СОВРЕМЕННАЯ АРХИТЕКТУРА 
И УСТРОЙСТВО КОМПЬЮТЕРОВ 


Вы разработчик программного обеспечения, системный архитек- 
тор или студент, изучающий устройство компьютеров? Вы ищете 
издание, которое подробно познакомит вас с внутренней архитек- 
турой и принципами работы цифровых устройств? В этом пошаго- 
вом руководстве на практических примерах вы узнаете, как рабо- 
тают современные компьютерные системы, виртуальные машины, 
смартфоны и облачные серверы. Вы получите представление овну- 
треннем устройстве процессоров и поймете, как они выполняют 
код, написанный на языках высокого уровня. 


Из этой книги вы узнаете об.основах современных компьютерных 
систем, подробно изучите устройство процессоров, включая ло- 
гические вентили, триггеры, регистры, последовательную логику, 
обработку прерываний и конвейеры управления. Вы сможете ис- 
следовать процессорные архитектуры и наборы инструкций, вклю- 
чая х86, х64, АРМ и 9$С-М, Вы узнаете, как реализовать процессор 
515С-\У на недорогой плате ЕРСА (ПЛИС), а также напишете про- 
грамму для квантовых вычислений и запустите ее на реальном кван- 
товом компьютере. 


Второе издание включает в себя описание архитектуры-и‘принци- 
пов проектирования, лежащих в основе таких важных областей, 
как кибербезопасность, блокчейн и майнинг криптовалют, а также 
управление беспилотными автомобилями. Прочитав эту книгу, вы 
получите глубокое представление о современных процессорах 
и архитектуре компьютеров, а также о будущих направлениях раз- 
вития этих технологий. 


Джим Ледин — основатель компании 1еат Епотеепяда, пс, 
специалист в сфере встраиваемых устройств, а также в раз- 
работке итестировании программного обеспечения для них, 
сертифицированный эксперт по безопасности информацион- 
ных систем и тестированию на проникновение. 


Цветные иллюстрации можно скачать по ссылке 
НИрз: //7йр.БП\.га/ 9785977518703.2р, 
атакже со страницы книги на сайте ОП\ги. 
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Предисловие 


Я — разработчик программного обеспечения, а не инженер-электронщик. На про- 
тяжении своей карьеры я разрабатывал самое разное программное обеспечение для 
решения множества различных проблем. Однако по случайности или причуде 
судьбы значительная часть моей карьеры была связана с созданием программного 
обеспечения, существенно более близкого к аппаратным средствам, чем у многих, 
а может быть, и у большинства, разработчиков программ в наши дни. 


В первые годы моего увлечения компьютерами я быстро понял, что невероятно не- 
совершенные по сегодняшним меркам устройства, к которым у меня был доступ, не 
смогут решать интересные задачи, если я не научусь программировать их на ас- 
семблере. Поэтому я научился писать программы на ассемблере 280, а затем и на 
ассемблерах для процессоров 6502 и 80х86. 


Программирование на ассемблере во многом отличается от написания программ на 
языках более высокого уровня. Тут вы чувствуете, как работает оборудование. Вы 
не можете игнорировать механизм распределения памяти, вам необходимо под- 
строить свой код под него. Вы не можете не принять во внимание имеющиеся в 
вашем распоряжении регистры, это ваши переменные, и вам нужно тщательно со- 
блюдать строгий порядок в управлении их работой. Вы также учитесь налажива- 
нию взаимодействия с другими устройствами через порты ввода-вывода, ведь по 
сути это единственный способ взаимодействия цифровых устройств друг с другом. 
Однажды, работая над особенно сложной задачей, я проснулся посреди ночи и по- 
нял, что мне снился ассемблер 80х86. 


Моя карьера и, что более важно, имеющееся в моем распоряжении оборудование 
развивались. В то время я получил работу своей мечты в отделе исследований и 
разработок компании-производителя компьютеров. Моя задача заключалась в улуч- 
шении взаимодействия операционных систем с нашим оборудованием, и я создавал 
драйверы устройств, чтобы использовать уникальные функции наших персональ- 
ных компьютеров. И в такой работе также было важно иметь хорошие прикладные 
знания о том, как работают аппаратные средства. 


Разработка программного обеспечения развивалась. Языки, которые мы использо- 
вали, становились более абстрактными, операционные системы, виртуальные ма- 
шины, контейнеры и общедоступная облачная инфраструктура все чаще скрывали 
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от нас, разработчиков программ, детали используемого оборудования. Недавно в 
социальной сети я общался с программистом на Г5Р, который не понимал, что в 
конечном счете его прекрасные функциональные декларативные структуры преоб- 
разуются в коды операций и значения в регистрах центрального процессора. Похо- 
же, у него не было рабочей модели того, как работают компьютеры, на которую он 
смог бы положиться. Ему не требовалось в этом разбираться, но я думаю, что если 
бы он это сделал, то стал бы лучшим программистом, чем был. 


В конце своей карьеры я работал над высокопроизводительными системами миро- 
вого класса. Перед коллективом, который я возглавлял, была поставлена задача 
создать одну из самых эффективных финансовых бирж в мире. 


Для того чтобы сделать это, нам снова нужно было основательно разобраться в том, 
как работает оборудование нашей системы. Это позволило нам в полной мере вос- 
пользоваться впечатляющей производительностью, предлагаемой современными 
аппаратными средствами. В это время, чтобы попытаться описать наш подход, мы 
позаимствовали термин из автоспорта. В 1970-х годах лучшим гонщиком "Форму- 
лы-1" был Джеки Стюарт. В одном из интервью у него спросили: "Нужно ли обла- 
дать навыками инженера, чтобы стать великим гонщиком?" Джеки ответил: "Нет, 
но вы должны испытывать „механическую симпатию“ к автомобилю". По сути, вам 
необходимо хорошо понимать возможности используемого оборудования, чтобы 
максимально эффективно использовать все его преимущества. 


Мы приняли эту идею "механической симпатии" и применили ее в нашей работе. 
Например, самые большие потери производительности в нашей торговой системе 
были связаны с отсутствием в кеш-памяти необходимых данных. Если данные, ко- 
торые мы хотели обработать, отсутствовали в соответствующем кеше, когда они 
были необходимы, производительность нашей системы падала на порядки. Поэто- 
му нам нужно было спроектировать наш код, даже если бы он был написан на язы- 
ке высокого уровня и запущен на виртуальной машине, таким образом, чтобы до- 
биться максимальной вероятности наличия нужных данных в кеше. Нам нужно 
было понять и научиться управлять параллелизмом в наших многоядерных процес- 
сорах, а также находить и извлекать выгоду из таких аспектов, как строки кеша 
процессора, преимущественно блочная структура памяти и других устройств хра- 
нения данных. Результатом стало достижение таких уровней производительности, 
которые некоторые люди считали невозможными. Современное оборудование впе- 
чатляет своими возможностями, когда вы используете их в полной мере. 


Этот интерес к оборудованию связан не только с высокопроизводительными вы- 
числениями. Несмотря на расхождение в конкретных оценках, все согласны с тем, 
что значительная часть углерода, вырабатываемого нами как биологическим видом, 
обусловлена энергоснабжением центров обработки данных, в которых хранится 
наш код. Я не могу представить себе ни одной области человеческой деятельности, 
которая была бы столь же неэффективной, как программное обеспечение, — для 
большинства систем вполне достижимо увеличение скорости до 100 раз, если вы 
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немного поработаете над управлением потоком информации через ваше оборудо- 
вание. Почти для всех систем можно добиться тысячекратного увеличения скоро- 
сти при определенной целенаправленной работе, но даже если бы мы могли получить 
хотя бы десятикратное ускорение за счет лучшего понимания того, как работает наш 
код и как он использует оборудование, на котором он работает, мы могли бы 
уменьшить углеродный след вычислений также в 10 раз. Эта идея гораздо важнее, 
чем повышение производительности лишь ради самой производительности. 


В конце концов, есть определенная степень необходимого понимания того, как ра- 
ботает ваш компьютер, и есть риск потерять представление о том, как функциони- 
рует оборудование, от которого мы все зависим. Признаюсь, я фанат своего дела. 
Я люблю разбираться в том, как все работает. Не всем нужно досконально знать, 
как работает оборудование, но относиться к нему как к некой магии — плохая идея, 
потому что это не магия. Это инженерное дело, а инженерная практика всегда свя- 
зана с компромиссами. Вы будете удивлены, как часто принципы работы вашего 
оборудования проявляют себя и влияют на поведение ваших программ, какими бы 
высокоуровневыми они ни были, даже если речь идет об написании кода для об- 
лачных систем на [ЛЗР. 


Для таких, как я, второе издание книги Джима Ледина "Современная архитектура и 
организация компьютеров" — это восторг. 


Я не инженер-электронщик и не хочу им быть. Однако для меня жизненно важной 
частью моих навыков как разработчика программного обеспечения является нали- 
чие хорошей практической модели того, как на самом деле работают аппаратные 
средства, на которые я полагаюсь. Я хочу поддерживать и развивать концепцию 
"механической симпатии". 


Эта книга ведет нас от основных концепций вычислений через рассмотрение пер- 
вых компьютеров и первых процессоров к потенциалу квантовых вычислений и 
другим направлениям ближайшего будущего, которые могут быть положены в ос- 
нову нашей вычислительной техники. Возможно, вы захотите понять, как работают 
современные процессоры, и досконально разобраться с их поразительной эффек- 
тивностью и их способностью поддерживать свою работу, извлекая нужные данные 
из хранилищ, которые в сотни раз медленнее их самих. Вас также могут заинтере- 
совать сложные идеи, выходящие за рамки только лишь аппаратных средств, на- 
пример о том, как работает майнинг криптовалют или как выглядит архитектура 
современного самоуправляемого автомобиля. Эта книга может ответить на эти и 
многие другие вопросы. 


Я думаю, что не только специалисты по теории вычислений и инженеры по вычис- 
лительной технике, но и разработчики программного обеспечения смогут лучше 
выполнять свою работу, располагая некоторым представлением о том, как работа- 
ют устройства, которые они используют в своей повседневной работе. Пытаясь ра- 
зобраться с крупной и сложной проблемой в программном коде, я до сих пор часто 
думаю: "Стоп! Ведь на самом деле это всего лишь биты, байты и коды операций, 
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так что же здесь происходит?" Это похоже на то, как химик, разбираясь в молеку- 
лах и химических соединениях, может вернуться к основным принципам, чтобы 
решить какую-либо сложную задачу. Это реальные первоосновы, и они могут по- 
мочь всем нам лучше понимать их. 


Я знаю, что буду регулярно обращаться к этой книге в течение многих лет, и наде- 
юсь, что вам понравится делать то же самое. 


Дэйв Фарли (Рауе ЕайЕу), 
независимый консультант по разработке программного обеспечения 
и учредитель компании Сопйпиоиз Рейуегу Ма 
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в то время, когда я был сосредоточен на работе над этим проектом. Я люблю вас, 
мои дорогие! 


Хочу также поблагодарить доктора Сару М. Нойвирт и Истока Иераса за их 
усердную работу по рецензированию каждой главы этой книги. Ваш вклад помог 
мне создать гораздо лучшую книгу! 


Отдельная благодарность Дэйву Фарли за столь красноречивое предисловие. 


О рецензентах 


Д-р Сара М. Нойвирт (Ог. Загаь М. Меи\уш В) — научный сотрудник с докторской 
степенью в группе модульных суперкомпьютеров и квантовых вычислений Уни- 
верситета Гёте (Франкфурт, Германия). Она также занимает должность приглашен- 
ного исследователя в Юлихском исследовательском центре суперкомпьютеров 
(Германия). Сара располагает более чем девятилетним опытом работы в академиче- 
ской сфере. В сферу ее исследовательских интересов входят высокопроизводитель- 
ные системы хранения данных, параллельный ввод-вывод и файловые системы, 
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модульные суперкомпьютеры (разукрупнение ресурсов и виртуализация), стандар- 
тизированный сравнительный анализ кластеров, высокопроизводительные вычис- 
ления и сети, распределенные системы и протоколы связи. 


Кроме того, Сара разработала учебную программу и в течение последних девяти 
лет вела курсы по параллельной компьютерной архитектуре, высокопроизводи- 
тельным сетям с внутрисистемной коммутацией и распределенным системам. 
В 2018 г. Сара получила докторскую степень по теории вычислительных машин в 
Гейдельбергском университете (Германия). Она защитила ученую степень с отли- 
чием (зитта сит ]ай4е) и была удостоена научной награды ХОМТА 2019 за свою 
выдающуюся диссертацию. Сара также имеет степень магистра наук (2012) и сте- 
пень бакалавра наук (2010) в области теории вычислений и математики Универси- 
тета Мангейма (Германия). Она выступала в роли технического рецензента для 
нескольких престижных конференций и журналов, посвященных высокопроизво- 
дительным вычислениям, в том числе для серии конференций 1ЕЕЕ/АСМ $5С, АСМ 
[СРР, ТЕЕЕ ШРОЗ, ТЕЕЕ НРСС, семинара РОЗУ в рамках [ЕЕЕ/АСМ $С, семинара 
РЕВМАУОЗТ в рамках АСМ НРОС, АСМ ТОС$, ТЕЕЕ Ассез$ и Е1зе\1ег ЕСС®. 


Исток Йерас (1240К ]егаз) получил степень бакалавра электротехники и степень 
магистра по теории вычислительных машин в Люблянском университете. Он ра- 
ботал в нескольких словенских компаниях над микроконтроллерами, решениями на 
основе программируемых логических интегральных схем (Ве!4-ргортаттаЫе рае 
аггау, ЕРСА) и специализированных интегральных схем (аррИсайноп-зресЯс пмергае4 
спсий, АЗС), а также со встроенным программным обеспечением и операционной 
системой Глпих. В свободное время Исток исследует клеточные автоматы и 
участвует в проектах разработки цифровых систем с открытым исходным кодом. 
В последнее время он сосредоточился на архитектуре набора инструкций К1$С-У. 


Присоединяйтесь к нашему сообществу в О1$сога! 


Присоединяйтесь к сообществу этой книги в О1$сог для участия в ежемесячных 
авторских семинарах "Спроси о чем угодно": 


№@рб://915согд.02/7 68а МВВКиУ 


я [п] 
‚— =: 


Вступление 


Приветствую читателей второго издания книги "Современная архитектура и орга- 
низация компьютеров". Мне было очень приятно получить множество отзывов и 
комментариев от читателей первого издания. Я ценю любые отзывы своих читателей, 
особенно тех, кто обращает мое внимание на какие-либо ошибки или упущения. 


В этой книге представлены основные технологии и компоненты, используемые в 
архитектурах современных процессоров и компьютеров, и обсуждается, как раз- 
личные архитектурные решения помогают создавать конфигурации компьютеров, 
оптимизированные для реализации конкретных потребностей. 


Сильно упрощая ситуацию, можно сказать, что современные компьютеры — это 
сложные устройства. Тем не менее, если применить для их рассмотрения иерархи- 
ческий принцип, то становятся ясными функции каждого уровня сложности. В гла- 
вах этой книги мы затронем очень много важных тем, и у нас будет возможность 
лишь ограниченного ознакомления с каждой из них. Моя цель состоит в том, чтобы 
предоставить ясное введение в каждую важную технологию и подсистему, которые 
вы можете найти в современном вычислительном устройстве, и объяснить их связь 
с другими компонентами системы. 


Это издание содержит обновленную информацию о технологиях, которые продви- 
нулись вперед со времени публикации первого издания, в него также добавлен зна- 
чительный объем новых сведений по нескольким важным областям, связанным с 
архитектурой компьютеров. Новые главы охватывают вычислительные архитекту- 
ры для кибербезопасности, блокчейна и майнинга биткоинов, а также самоуправ- 
ляемых транспортных средств. 


Безопасность вычислительных систем всегда была важным вопросом, но недавние 
случаи использования серьезных уязвимостей в широко распространенных опера- 
ционных системах и приложениях привели к значительным негативным последст- 
виям, которые ощущаются в странах по всему миру. Эти кибератаки подчеркнули 
необходимость включения средств защиты от киберугроз в качестве основопола- 
гающего элемента архитектуры вычислительных систем. 


Я не буду приводить длинный список ссылок для дальнейшего чтения. Интернет — 
ваш лучший помощник в этом отношении. 


Если вам удастся обойти суету политической и социальной аргументации в Интер- 
нете, вы окажетесь в просторной, прохладной и тихой библиотеке, содержащей ог- 
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ромное количество накопленных человеческих знаний. Научитесь использовать 
расширенные функции вашей любимой поисковой системы. Кроме того, сможете 
отличать качественную информацию от мнений неосведомленных людей. Если у 
вас есть какие-либо сомнения относительно информации, которую вы ищете, про- 
верьте несколько источников. Обратите внимание на источник: если вам нужна 
информация о процессоре |, ищите документацию, опубликованную ше. 


К концу этой книги у вас сложится четкое представление о компьютерных архитек- 
турах, используемых в настоящее время в самых разных цифровых системах. Кро- 
ме того, вы сможете расширить свое представление о соответствующих тенденциях 
в архитектурных технологиях, разрабатываемых в настоящее время, а также о не- 
которых возможных прорывных достижениях ближайшего будущего, которые мо- 
гут кардинально повлиять на развитие архитектуры вычислительных систем. 


Для кого эта книга 


Эта книга предназначена для разработчиков программного обеспечения, студентов, 
изучающих вычислительную технику, проектировщиков систем, специалистов в 
области теории вычислительных машин и инженерного анализа, а также всех, кто 
хочет понять архитектуру и принципы проектирования, лежащие в основе совре- 
менных компьютерных систем любого типа — от миниатюрных встроенных уст- 
ройств до смартфонов и ферм облачных серверов размером с большой склад. Чита- 
тели также смогут ознакомиться с тенденциями развития этих технологий в 
ближайшие годы. Общее понимание компьютерных процессоров полезно, но не 
обязательно. 


Как организована эта книга 


Глава 1 "Введение в архитектуру компьютеров" начинается с краткой истории ав- 
томатических вычислительных устройств и описывает значительные технологиче- 
ские достижения, которые привели к ряду прорывов в вычислительных возможно- 
стях. Затем следует обсуждение закона Мура с оценкой его применимости в 
предыдущие десятилетия и возможных последствий для будущего. Основные поня- 
тия компьютерной архитектуры представлены в контексте микропроцессора 6502. 


Глава 2 "Цифровая логика" представляет транзисторы, используемые в качестве 
переключающих устройств, и объясняет их использование в построении логиче- 
ских вентилей. Затем мы увидим, как создаются триггеры и регистры путем объе- 
динения простых вентилей. Здесь вводится понятие последовательностной логики, 
т.е. логики, содержащей информацию о состоянии. Глава заканчивается обсужде- 
нием цифровых схем с синхронизацией. 


Глава 3 "Элементы процессора" начинается с концептуального описания универ- 
сального процессора. Мы рассмотрим концепции набора инструкций, набора реги- 
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стров, а также загрузки, декодирования, выполнения и определения последователь- 
ности инструкций. 


Также здесь обсуждаются операции загрузки и сохранения данных в памяти. Глава 
включает в себя описание инструкций ветвления и их использования в циклах и 
условной обработке. Представлены некоторые практические соображения, приво- 
дящие к необходимости обработки прерываний и операций ввода-вывода. 


В главе 4 "Компоненты компьютерной системы" обсуждаются память компьютера 
и ее интерфейс с процессором, в том числе многоуровневое кеширование. Описаны 
требования к вводу-выводу, включая обработку прерываний, буферизацию и выде- 
ленные процессоры ввода-вывода. Мы обсудим некоторые особые требования к 
устройствам ввода-вывода, включая клавиатуру и мышь, дисплей и сетевой интер- 
фейс. Глава заканчивается описательными примерами этих компонентов в совре- 
менных компьютерных системах, среди которых мобильные устройства, персо- 
нальные компьютеры, игровые системы, облачные серверы и специализированные 
системы машинного обучения. 


В главе 5 "Аппаратно-программный интерфейс" обсуждается реализация высоко- 
уровневых функций, которые должна предоставлять операционная система компь- 
ютера, включая ввод-вывод для накопителей, обмен данными по сетям и взаимо- 
действие с пользователями. В этой главе описываются уровни программного 
обеспечения, реализующие эти функции, начиная с уровня набора инструкций и 
регистров процессора. Также описаны функции операционной системы, в том чис- 
ле ее загрузка, многопроцессорность и многопоточность. 


Глава 6 "Специализированные вычисления" исследует области вычислений, кото- 
рые, как правило, менее очевидны для большинства пользователей, включая систе- 
мы реального времени, цифровую обработку сигналов и обработку данных в гра- 
фических процессорах. Мы обсудим уникальные требования, связанные с каждой 
из этих областей, и рассмотрим примеры современных устройств, реализующих эти 
функции. 


Глава 7 "Архитектура процессора и памяти" подробно рассматривает архитектур- 
ные решения современных процессоров, включая фон-неймановскую, гарвардскую 
и модифицированную гарвардскую. Здесь обсуждается реализация виртуальной 
памяти со страничной организацией. Представлена практическая реализация функ- 
ций управления памятью в архитектуре компьютера, а также функций блока управ- 
ления памятью. 


В главе 8 "Методы повышения производительности" обсуждается ряд методов по- 
вышения производительности, которые обычно используются для достижения мак- 
симальной скорости выполнения программ в реальных компьютерных системах. 
В этой главе рассматриваются наиболее важные методы повышения производи- 
тельности систем, включая использование кеш-памяти, конвейерной обработки ин- 
струкций, параллелизма инструкций и обработку на основе принципа "одна инст- 
рукция, множество данных" ($1т2]е шзгасйоп-тире даа ЗПМО). 
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Глава 9 "Специализированные расширения процессоров" фокусируется на расшире- 
ниях, обычно реализуемых на уровне набора инструкций процессора, с целью пре- 
доставления дополнительных системных возможностей помимо общих требований 
к обработке данных. Представленные расширения включают в себя привилегиро- 
ванные режимы процессора, арифметику с плавающей запятой, управление пита- 
нием и безопасностью системы. | 


Глава 10 "Современные архитектуры и наборы инструкций процессоров" исследу- 
ет особенности архитектуры и наборов инструкций современных процессоров, 
включая х86, хб4 и АКМ. Одной из проблем, возникающих при производстве се- 
мейства процессоров в течение нескольких десятилетий, является необходимость 
поддерживать обратную совместимость с кодом, написанным для процессоров 
прежних поколений. Необходимость поддержки унаследованного кода приводит к 
увеличению сложности процессоров более поздних поколений. В этой главе рас- 
смотрены некоторые атрибуты этих процессорных архитектур, которые обусловле- 
ны поддержкой устаревших требований. 


Глава 11 "Архитектура и набор инструкции Е15С-И" представляет захватывающую 
новую архитектуру процессоров В1$С-У (произносится как "риск файв") и соответ- 
ствующий набор инструкций. В$С-У — это свободно распространяемая специфи- 
кация с полностью открытым исходным кодом для вычислительной архитектуры с 
сокращенным набором инструкций. Выпущена полная спецификация набора инст- 
рукций, и в настоящее время доступно несколько аппаратных реализаций этой ар- 
хитектуры. Продолжается разработка спецификаций для ряда расширений набора 
инструкций. В этой главе рассматриваются функции, доступные в архитектуре 
ВГ$С-У, варианты ее реализации и представлен набор инструкций К1$С-У. Мы 
также обсудим применение архитектуры В]$С-У в мобильных устройствах, персо- 
нальных компьютерах и серверах. 


Глава 12 "Виртуализация процессоров" представляет концепции, связанные с вир- 
туализацией процессоров, и объясняет многочисленные преимущества, возникаю- 
щие в результате применения виртуализации. Глава включает примеры виртуали- 
зации на основе инструментов и операционных систем с открытым исходным 
кодом. Эти инструменты позволяют создавать на обычном компьютере точные с 
точки зрения набора инструкций представления различных компьютерных архи- 
тектур и операционных систем. Мы также обсудим преимущества виртуализации 
при разработке и развертывании реальных программных приложений. 


Глава 13 "Специализированные компьютерные архитектуры" объединяет темы, 
рассмотренные в предыдущих главах, в целях выработки подхода к созданию архи- 
тектуры компьютерной системы для выполнения уникальных требований пользо- 
вателя. Мы обсудим конкретные категории областей применения, включая мобиль- 
ные устройства, персональные компьютеры, игровые системы, поисковые системы 
и нейронные сети. 


Глава 14 "Архитектуры для обеспечения кибербезопасности и конфиденциально- 
сти вычислений" сосредоточена на потребностях в защите критически важных об- 
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ластей, включая системы национальной безопасности и обработку финансовых 
транзакций. Эти системы должны быть устойчивыми к широкому спектру угроз 
кибербезопасности, в том числе к проникновению вредоносного кода, атакам через 
скрытые каналы и путем физического доступа к аппаратным средствам компьюте- 
ров. Среди тем, рассматриваемых в этой главе, — угрозы кибербезопасности, шиф- 
рование, цифровые подписи и архитектурные решения для защиты аппаратных 
средств и программного обеспечения. 


Взрыв интереса к криптовалютам и их растущее признание основными финансо- 
выми институтами и торговыми предприятиями демонстрируют, что данная об- 
ласть вычислительной техники находится на пути непрерывного роста. В это изда- 
ние книги добавлена глава о блокчейне и вычислительных требованиях майнинга 
биткоинов. 


Глава 15 "Архитектуры блокчейна и майнинга биткоинов" представляет концеп- 
ции, связанные с блокчейном, открытым, криптографически защищенным реест- 
ром, содержащим последовательность транзакций. За введением следует обзор 
процесса майнинга биткоинов, который добавляет транзакции в блокчейн Вцсот и 
вознаграждает тех, кто выполняет эту задачу, оплатой в биткоинах. Для обработки 
биткоинов требуется высокопроизводительное вычислительное оборудование, ко- 
торое представлено с точки зрения компьютерной архитектуры для майнинга бит- 
коинов текущего поколения. 


Продолжающийся рост числа автомобилей с возможностью частичного или полно- 
го автономного вождения требует надежных вычислительных систем с высокой 
производительностью, отвечающих требованиям безопасной автономной эксплуа- 
тации транспортных средств на дорогах общего пользования. 


Глава 16 "Архитектуры для самоуправляемых автомобилей" представляет возмож- 
ности, которые должны быть реализованы в вычислительных архитектурах само- 
управляемых автомобилей. Глава начинается с обсуждения требований по обеспече- 
нию безопасности самоуправляемого автомобиля и его пассажиров, а также других 
транспортных средств, пешеходов и стационарных объектов. Затем мы рассмотрим 
типы датчиков и источники информации, которые предоставляют самоуправляемым 
автомобилям входные данные во время движения, а также типы вычислений, необ- 
ходимых для эффективного управления автомобилем. Глава завершится обзором 
примера архитектуры компьютера для самоуправляемого автомобиля. 


В главе 17 "Квантовые вычисления и другие перспективные направления в вычис- 
лительных архитектурах" оцениваются перспективы развития компьютерных ар- 
хитектур. В ней рассматриваются важные достижения и современные тенденции, 
которые привели к текущему состоянию компьютерных архитектур, а также про- 
гнозируется дальнейшее развитие этих тенденций для определения возможных бу- 
дущих технологических направлений. Также обсуждаются потенциально прорыв- 
ные технологии, которые могут изменить направление развития компьютерных 
архитектур в будущем. В заключение я дам рекомендации по некоторым подходам 
к профессиональному совершенствованию архитектора компьютеров, которые мо- 
гут помочь сформировать набор полезных для будущего навыков. 
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Как и прочие главы, каждая из трех новых глав содержит упражнения, помогающие 
лучше понять тему главы и закрепить полученную информацию в вашей базе знаний. 


Я надеюсь, что вы получите удовольствие от прочтения обновленного издания, так 
же, как и я, когда работал над этой книгой. Приятного чтения! 


Как получить максимальную 
отдачу от этой книги 


Каждая глава этой книги завершается набором упражнений. Для того чтобы из- 
влечь из книги максимальную пользу и закрепить в уме некоторые из наиболее 
сложных концепций, я рекомендую вам поработать над каждым упражнением. 
Полные решения для всех упражнений приведены в книге и доступны в Интернете 
по адресу В рз://2пиЪ.сот/Раск Ри 1$ Пт?2/Модегптп-Сотрщег-АгспКесиге-апд- 
ОграптаНоп-Зесопд-ЕЧ оп. 


В случае необходимости внесения изменений в примеры кода и ответы к упражне- 
ниям эти изменения появятся в этом же репозитории СИНУб. 


Загрузите файлы с примерами кода 


Комплект исходного кода для данной книги размещен на СИНуБ по адресу 
В@рз://2пиБ.сот/РаскРиБ ИВ т?/Модегп-Сотршег-АгсВНесвиге-апд- 
ОтграпгаНоп-5есопд-ЕЧ!юп. У нас также есть другие комплекты исходного кода 
из нашего обширного ‘каталога книг и видео, ‘доступных по адресу 
Врз://о ВиБ.сот/Раск Ри $ то/. Рекомендуем ознакомиться с ними! 


Загрузите цветные изображения 


Мы также предоставляем РОЕ-файл с цветными изображениями снимков экрана и 
диаграмм, использованных в этой книге. Вы можете скачать этот файл по адресу: 
В рз://5вайс.раск(-сап.сот/9о\утюа95/9781803234519_СойогИпагез.рай. 


Условные обозначения и соглашения 


В книге используются следующие типографские условные обозначения. 


СодеТпТехе указывает на примеры кода в тексте, имена таблиц баз данных, имена 
папок, имена файлов, расширения файлов, пути, пользовательский ввод и имена 
учетных записей в ТулИег. Пример: "Вычитание с использованием инструкции $8С 
может немного сбить с толку начинающих программистов на языке ассемблера 6502". 


' Файл с цветными иллюстрациями для русскоязычного издания представлен здесь: 
В р5://274йр.6Ву.ги/9785977518703.271р. 
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Листинг кода обозначается следующим образом: 


; Сложение четырех байтов с использованием режима непосредственной адресации 
ГРА #$04 

СЕС 

АОС #$03 

АОС #$02 

АОС #$01 


Любые примеры ввода или вывода с использованием командной строки записыва- 
ются следующим образом: 


С: \>Бсаеа1+ 


\1падом5 Вооф Мапавег 


14еп141ег {Боо$мег} 


Полужирный шрифт обозначает новый термин или важное слово, интернет-адрес 
и адрес электронной почты; таким же образом выделяются в тексте слова, которые 
вы видите на экране, — названия пунктов меню или элементов диалоговых окон. 
Пример: "Поскольку теперь существуют четыре набора, поле Набор в физическом 
адресе уменьшается до двух битов, а поле Тег увеличивается до 24 бит". 


№4 Предупреждения или важные примечания выглядят таким образом. 


Свяжитесь с нами 


Обратная связь со стороны наших читателей всегда приветствуется. 


Общие отзывы. Отзывы общего характера отправляйте по электронной почте 
ГееЯЪаск@расКриБ.сот, указав в теме сообщения название книги. Если у вас есть 
вопросы по любому аспекту этой книги, пожалуйста, напишите нам по адресу 
ЧиезНоп$@ расКриБ.сот. 


Опечатки. Мы приложили все разумные усилия, чтобы обеспечить точность со- 
держимого книги, но ошибки иногда случаются. Если вы нашли опечатку в этой 
книге, мы будем признательны, если вы сообщите нам об этом. Зайдите на сайт 
В@р://у\уу.раскриь.сот/зибтй-еггайа, выберите свою книгу, щелкните по ссыл- 
ке Еггаа Зиби5 $101 Еогт (Форма уведомления об опечатках) и введите сведения 
об опечатке. 
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Пиратство. Если в Интернете вам встретятся незаконные копии наших произведе- 
ний в любой форме, мы будем признательны, если вы сообщите нам адрес их ме- 
стонахождения или название веб-сайта. Пожалуйста, отправьте нам ссылку на та- 
кой материал по адресу соруй? В @расКриЬ.сот. 


Если вы хотите стать автором. Если есть тема, в которой у вас есть опыт, и вы 
заинтересованы в написании или участии в написании книги, пожалуйста, посетите 
веб-сайт В@р://ашПог$.расКриЪ.сот. 


Поделитесь своими мыслями 


Мы будем рады узнать ваше мнение после того, как вы прочтете второе издание 
книги "Современная архитектура и организация компьютеров". Отсканируйте при- 
веденный ниже ОК-код, чтобы перейти на страницу рецензирования этой книги и 
поделиться своим мнением. 


Ваш отзыв важен для нас и технического сообщества, он поможет нам убедиться, 
что мы предоставляем информацию наивысшего качества. 


Введение 
в архитектуру компьютеров 


Архитектура автоматических вычислительных систем прошла долгий путь от пер- 
вых механических вычислителей, созданных почти два века назад, до широкого 
спектра современных электронных компьютерных технологий, которые мы прямо 
или косвенно используем каждый день. На этом пути были периоды постепенных 
технологических улучшений, чередующиеся с прорывными достижениями, кото- 
рые резко меняли траекторию развития отрасли. Можно ожидать, что эти тенден- 
ции сохранятся и в ближайшие годы. 


В 1980-х годах, на заре развития персональных вычислительных устройств, студен- 
там и техническим специалистам, стремившимся узнать как можно больше о ком- 
пьютерных технологиях, был доступен лишь ограниченный набор предметов для 
изучения. Если они располагали собственным компьютером, то это, скорее всего, 
был [ВМ РС или Арре П. Если они работали в организации с вычислительным цен- 
тром, то могли бы использовать большую ЭВМ от ВМ или мини-компьютер УАХ 
от П\рИа| Едитртет Согроганоп. Эти примеры и ограниченное число подобных 
систем охватывали практически все возможности знакомства большинства людей с 
компьютерными системами того времени. 


Сегодня существует множество специализированных вычислительных архитектур 
для удовлетворения самых разных потребностей пользователей. В своих карманах 
мы носим миниатюрные компьютеры, которые могут совершать телефонные вызо- 
вы, записывать видео и предоставлять полнофункциональный доступ в Интернет. 
Персональные компьютеры (ПК) остаются популярными в формате, внешне похо- 
жем на ПК прошлых десятилетий. Однако современные ПК на несколько порядков 
превосходят предыдущие поколения по вычислительной мощности, объему памяти, 
дисковому пространству, графической производительности и доступным способам 
связи. Эти возможности позволяют современным ПК легко решать задачи, выпол- 
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нение которых было бы немыслимо на ранних ПК, такие как формирование трех- 
мерных изображений с высоким разрешением в реальном времени. 


Компании, предлагающие веб-сервисы сотням миллионов пользователей, создают 
огромные хранилища, заполненные тысячами тесно скоординированных компью- 
терных систем, способных реагировать на постоянный поток пользовательских за- 
просов с необычайной скоростью и точностью. Системы машинного обучения обу- 
чаются на основе анализа огромных объемов данных для выполнения сложных 
действий, таких как вождение автомобилей. 


Эта глава начинается с представления некоторых вычислительных устройств, сыг- 
равших важную роль в истории отрасли, и связанных с ними технологических про- 
рывов. Затем мы рассмотрим некоторые важные современные тенденции, связанные 
с технологическими достижениями, и познакомимся с основными концепциями 
компьютерной архитектуры, включая внимательное изучение микропроцессора 
6502 и его набора инструкций. В этой главе будут рассмотрены следующие темы: 


» эволюция автоматических вычислительных устройств; 
» закон Мура; 


» архитектура компьютеров. 


Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 
ВИрз://2ИВиЬ.сот/РаскРи БИ то/Модегп-Сотршег-АгсВ{есвиге-апд- 
Ограп7аНоп-Зесопд-Е Чоп. 


Эволюция автоматических 
вычислительных устройств 


В этом разделе рассматриваются некоторые классические машины из истории ав- 
томатических вычислительных устройств, при этом основное внимание уделяется 
важным достижениям, воплощенным в каждой из них. Аналитическая машина Бэб- 
биджа включена сюда благодаря множеству гениальных нововведений, представ- 
ленных в ее конструкции. Обсуждение других систем обусловлено тем, что они во- 
площали в себе значительные технологические достижения и за время своего 
существования выполнили значительную практическую работу. 


Аналитическая машина Чарльза Бэббиджа 


Несмотря на то что рабочая модель этой аналитической машины никогда не была 
построена, в подробных записях, которые вел Чарльз Бэббидж с 1834 г. до своей 
смерти в 1871 г., была описана вычислительная архитектура, которая казалась 
вполне завершенной и работоспособной. Эта аналитическая машина предназнача- 
лась для использования в качестве универсального программируемого вычисли- 
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тельного устройства. Ее конструкция была полностью механической, а изготовить 
машину предполагалось по большей части из латуни. Аналитическая машина 
должна была приводиться в движение валом от парового двигателя. 


Для своей аналитической машины Бэббидж позаимствовал перфокарты ткацкого 
станка Жаккара, вращающиеся цилиндры со штифтами, используемые в музыкаль- 
ных шкатулках, и технологии своей более ранней разностной машины (также не 
законченной при его жизни и представлявшей собой скорее специализированное 
счетное устройство, чем компьютер), в остальном ее конструкция была оригиналь- 
ным творением Бэббиджа. 


В отличие от большинства современных компьютеров, эта аналитическая машина 
представляла числа в десятичном виде со знаком. Решение использовать числа с 
основанием 10, а не логику большинства современных компьютеров с основанием 2, 
было обусловлено фундаментальным различием между механическими техноло- 
гиями и цифровой электроникой. Изготовление механических колес с 10 положе- 
ниями — несложная задача, поэтому Бэббидж выбрал привычный человеку формат 
с основанием 10, т. к. он был ненамного сложнее с технической точки зрения, чем 
использование какой-либо другой системы счисления. С другой стороны, простые 
цифровые схемы не способны поддерживать 10 различных состояний с той же лег- 
костью, с которой это достигается с помощью механического колеса. 


Все числа в аналитической машине состояли из 40 десятичных цифр. Большое ко- 
личество цифр, вероятно, было выбрано для облегчения решения проблем с число- 
вым переполнением. Эта аналитическая машина не поддерживала математику с 
плавающей запятой. 


Каждое число хранилось на вертикальной оси, содержащей 40 колес, каждое из ко- 
торых могло находиться в 10 положениях, соответствующих цифрам от 0 до 9. Со- 
рок первое колесо определяло знак: любое четное число на этом колесе представ- 
ляло положительный знак, а любое нечетное число — отрицательный. Ось 
аналитической машины была в чем-то аналогична регистру, используемому в со- 
временных процессорах, за исключением того, что считывание числа оси было раз- 
рушительным — после этой операции число обращалось в 0. Если требовалось со- 
хранить значение оси после считывания, другая ось должна была сохранить копию 
значения во время считывания. Числа переносились с одной оси на другую или ис- 
пользовались в вычислениях путем зацепления шестерни с каждым колесом и вра- 
щения колеса для извлечения числового значения. Набор осей, служащих систем- 
ной памятью, назывался складом. 


Для сложения двух чисел использовался процесс, напоминающий метод сложения, 
которому обучают школьников. Предположим, что число, хранящееся на одной 
оси, назовем его слагаемым, должно быть добавлено к числу на другой оси, кото- 
рое мы назовем аккумулятором. Машина должна была соединить колесо каждой 
цифры слагаемого с соответствующим колесом цифры аккумулятора посредством 
зубчатой передачи. Затем она должна была одновременно вращать колесо каждой 
цифры слагаемого в направлении нуля, в то время как колесо цифры аккумулятора 
совершало эквивалентный поворот в возрастающем направлении. Если цифра ак- 
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кумулятора совершала переход от 9 к 0, следующая по старшинству цифра аккуму- 
лятора увеличивалась на 1. Эта операция переноса могла распространяться на 
столько цифр, сколько было необходимо (подумайте о добавлении 1 к 999 999). 
К концу процесса ось слагаемого должна была содержать значение 0, а ось аккуму- 
лятора — сумму двух чисел. Распространение переносов от одной цифры к другой 
было наиболее сложной с точки зрения механики частью процесса сложения. 


Операции в аналитической машине выполнялись с помощью вращающихся цилин- 
дров, похожих на барабан музыкальной шкатулки, в конструкции, называемой 
мельницей, которая аналогична блоку управления современного процессора. 


Каждая инструкция аналитической машины была закодирована в вертикальном ря- 
ду позиций на цилиндре, где наличие или отсутствие штифта в определенном месте 
либо задействовало часть механизма машины, либо оставляло состояние соответст- 
вующей секции неизменным. Согласно оценке скорости выполнения операций, 
сделанной Бэббиджем, сложение двух 40-значных чисел, включая распространение 
переносов, должно было занять около 3 секунд. 


Бэббидж разработал для своей машины несколько важных концепций, которые ос- 
таются актуальными и для современных компьютерных систем. Его конструкция 
поддерживала определенную степень параллельной обработки, предусматриваю- 
щей одновременное выполнение операций умножения и сложения, что ускоряло 
вычисление серий значений, предназначенных для вывода в виде числовых таблиц. 
Математические операции, такие как сложение, поддерживали некоторую форму 
конвейерной обработки, при которой последовательные операции над разными 
значениями перекрываются во времени. 


Бэббидж хорошо знал о трудностях, связанных со сложными механическими уст- 
ройствами, таких как трение, люфт шестерен и износ с течением времени. Для того 
чтобы предотвратить ошибки, вызванные этими эффектами, в машину были 
встроены механизмы, называемые блокировками, которые применялись при пере- 
даче данных между осями. Блокировки заставляли колеса цифр занимать правиль- 
ные положения и предотвращали накопление небольших ошибок, вызванных по- 
степенным смещением колес в направлении неправильных значений. 
Использование блокировок аналогично усилению потенциально слабых входных 
сигналов для получения более сильных выходных сигналов с помощью цифровых 
логических вентилей в современных процессорах. 


Для программирования аналитической машины предполагалось использовать пер- 
фокарты. Кроме того, в ней должны были поддерживаться операции ветвления и 
вложенные циклы. Самая сложная программа, предназначенная для выполнения на 
этой аналитической машине, была разработана Адой Лавлейс для вычисления чи- 
сел Бернулли — важной последовательности в теории чисел. Код машины для вы- 
полнения этих вычислений признан первой опубликованной компьютерной про- 
граммой значительной сложности. 


Бэббидж построил пробную модель части мельницы своей аналитической машины, 
которая в настоящее время выставлена в Музее науки в Лондоне. 
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ЕМАС 


Создание машины ЕМТАС, название которой расшифровывается как Еесготис 
Митенса! Пиеогаюг ап@ Сотршег (электронная счетная машина-интегратор), 
было завершено в 1945 г., и она стала первым программируемым универсальным 
электронным компьютером. Система потребляла 150 кВт электроэнергии, занимала 
170 квадратных метров площади и весила 27 тонн. 


Ее конструкция была основана на электронных лампах, диодах и реле. Машина 
ЕМТАС содержала более 17 000 электронных ламп, которые выполняли функции 
переключающих элементов. 


Подобно аналитической машине Бэббиджа, она использовала десятичное представ- 
ление 10-значных десятичных чисел, реализованное с помощью 10-позиционных 
кольцевых счетчиков (кольцевой счетчик будет обсуждаться в главе 2). 


Входные данные вводились с помощью устройства чтения перфокарт от 1ВМ, а ре- 
зультаты вычислений выводились посредством перфорационной машины. 


Архитектура ЕМГАС была способна выполнять сложные последовательности шагов 
обработки, включая циклы, ветвление и подпрограммы. Система содержала 20 де- 
сятиразрядных аккумуляторов, которые действовали как регистры современных 
компьютеров. Изначально у машины не было никакой памяти, кроме аккумулято- 
ров. Если промежуточные значения требовались для использования в последующих 
вычислениях, эти данные приходилось записывать на перфокарты и по мере необ- 
ходимости считывать обратно в машину. ЕМТАС могла выполнять около 385 опе- 
раций умножения в секунду. 


Программы ЕМГАС представляли собой проводные соединения на коммутационной 
панели и таблицы функций на основе переключателей. Программирование системы 
было трудоемким процессом, на выполнение которого у группы талантливых жен- 
щин-программистов часто уходили недели. Надежность была проблемой, т. к. ва- 
куумные лампы регулярно выходили из строя, что требовало ежедневного выпол- 
нения процедуры поиска и устранения неполадок для выявления и замены 
неисправных ламп. 


В 1948 г. ЕМТАС была улучшена за счет добавления возможности программирова- 
ния системы с помощью перфокарт вместо коммутационных панелей. Это значи- 
тельно ускорило разработку программ. Выступая в качестве консультанта по этому 
обновлению, Джон фон Нейман предложил архитектуру обработки, основанную на 
единой области памяти, содержащей программные инструкции и данные, блоке 
обработки с арифметико-логическим устройством и регистрами, а также блоке 
управления, содержащем регистр инструкций и программный счетчик. Многие со- 
временные процессоры наследуют эту общую структуру, известную теперь как ар- 
хитектура фон Неймана. Мы подробно обсудим ее в главе 3. 


Ранние области применения машины ЕМТАС включали в себя анализ, связанный с 
разработкой водородной бомбы, и расчет таблиц стрельбы для дальнобойной ар- 
тиллерии. 
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ВМ РС 


За годы, прошедшие после создания ЕМГАС, произошло несколько технологиче- 
ских прорывов, которые привели к значительному прогрессу в компьютерной архи- 
тектуре. 

» Появление транзистора, который изобрели в 1947 г. Джон Бардин, Уолтер 
Браттейн и Уильям Шокли, обеспечило значительное улучшение по сравне- 
нию с технологией электронных ламп, преобладавшей в то время. Транзисторы 
были быстрее, компактнее, потребляли меньше энергии, а после оптимизации 
производственных процессов стали намного надежнее ламп, подверженных 
отказам. 


» После появления в 1958 г. идеи интегральных схем, предложенной Джеком 
Килби из Техаз шлите, начался процесс объединения большого количе- 
ства ранее отдельных компонентов на одном кремниевом чипе. 


» В 1971 г. компания ше! начала производство первого поступившего в откры- 
тую продажу микропроцессора ш@! 4004. Модель 4004 предназначалась для 
использования в электронных калькуляторах и была специализирована для 
работы с 4-битными двоично-десятичными числами. 


Со скромного начала в виде шп 4004 микропроцессорная технология быстро раз- 
вивалась в течение следующего десятилетия: число элементов схем на каждом чипе 
стремительно росло, а возможности микропроцессоров, реализованных на этих чи- 
пах, расширялись. 


Микропроцессор ше! 8088 


ВМ выпустила персональный компьютер 1ВМ РС в 1981 г. Оригинальный ПК со- 
держал микропроцессор Пе 8088, работавший на тактовой частоте 4,77 МГц, 
и имел 16 Кбайт оперативной памяти (оперативное запоминающее устройство, 
ОЗУ) с возможностью расширения до 256 Кбайт. Он комплектовался одним или (по 
дополнительному запросу) двумя дисководами для гибких дисков. Также был дос- 
тупен цветной монитор. Более поздние версии этого ПК поддерживали больше па- 
мяти, но поскольку часть адресного пространства была зарезервирована для видео- 
памяти и постоянной памяти (постоянное запоминающее устройство, ПЗУ), эта 
архитектура могла поддерживать ОЗУ максимальным объемом 640 Кбайт. 


Процессор 8088 содержал четырнадцать 16-разрядных регистров. Четыре из них 
выполняли функции регистров общего назначения (АХ, ВХ, СХ и 0Х). Четыре других 
были регистрами сегментов памяти (С$, 0$, $$ и Е$), которые расширяли адресное 
пространство до 20 бит. Сегментная адресация функционировала путем добавления 
16-битного значения сегментного регистра, сдвинутого влево на 4 бита, к 16-битно- 
му значению смещения, содержащемуся в инструкции, для получения адреса физи- 
ческой памяти в диапазоне до 1 Мбайт. 


Остальными регистрами процессора 8088 были указатель стека ($Р), указатель 
базы (ВР), индекс источника (51), индекс приемника (101), указатель инструк- 
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ций (]Р) и флаги состояния (ЕГАС5). В современных процессорах семейства х86 
реализована архитектура, удивительно похожая на этот набор регистров (детали 
архитектуры х86 описаны в главе 10). Наиболее очевидные различия между про- 
цессорами 8088 и х86 — увеличение разрядности регистров в х86 до 32 битов и до- 
бавление пары сегментных регистров (Е5 и 6$), которые сегодня используются в ос- 
новном как указатели данных в многопоточных операционных системах. 


Процессор 8088 имел 8-разрядную внешнюю шину данных — это означало, что для 
чтения или записи 16-битного значения требовались два цикла шины. Это был шаг 
назад по производительности в сравнении с более ранним процессором 8086, кото- 
рый оснащался 16-разрядной внешней шиной. Однако применение 8-разрядной 
шины позволило сэкономить на производстве ПК и обеспечило совместимость с 
более дешевыми 8-разрядными периферийными устройствами. Такой экономичный 
подход к проектированию помог снизить цену ПК до уровня, доступного большему 
количеству потенциальных покупателей. 


Для памяти программ и памяти данных совместно использовалось одно и то же ад- 
ресное пространство, а доступ к памяти 8088 осуществлялся по одной шине. Дру- 
гими словами, в 8088 была реализована архитектура фон Неймана. Набор инструк- 
ций 8088 включал в себя инструкции для перемещения данных, арифметических и 
логических операций, манипулирования строками, передачи управления (условные 
и безусловные переходы, а также вызов подпрограмм и возврат из них), операций 
ввода-вывода и различных дополнительных функций. Для выполнения одной инст- 
рукции процессору требовалось в среднем около 15 тактов, что обеспечивало ско- 
рость выполнения около 0,3 млн инструкций в секунду (тИоп шугисйоп$ рег 
5есоп4, МТР5). 


Процессор 8088 поддерживал девять различных режимов адресации памяти. Такое 
разнообразие режимов было необходимо для эффективного доступа к одному эле- 
менту за раз, а также для перебора последовательностей данных. 


Сегментные регистры в архитектуре 8088 предоставляли, казалось бы, умный спо- 
соб расширения диапазона адресуемой памяти без увеличения длины большинства 
инструкций, ссылающихся на ячейки памяти. Каждый сегментный регистр обеспе- 
чивал доступ к блоку памяти размером 64 Кбайт, начинающемуся с адреса физиче- 
ской памяти, кратного 16 байтам. Другими словами, 16-разрядный сегментный ре- 
гистр представлял 20-битный базовый адрес с четырьмя младшими битами, 
равными нулю. Таким образом, инструкции могли ссылаться на любую ячейку в 
сегменте длиной 64 Кбайт, используя 16-битное смещение от адреса, определенно- 
го регистром сегмента. 


Регистр С$ устанавливал местоположение сегмента кода в памяти и использовался 
при извлечении инструкций и выполнении переходов, вызовов подпрограмм и воз- 
вратов из них. Регистр ОЗ определял местоположение сегмента данных для исполь- 
зования инструкциями, перемещающими данные в память и из памяти. Регистр 3$ 
задавал местоположение сегмента стека, которое использовалось для выделения 
локальной памяти внутри подпрограмм и для хранения адресов возврата из подпро- 
грамм. 
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Программы, которым требовалось менее 64 Кбайт в каждом из сегментов кода, 
данных и стека, могли полностью игнорировать сегментные регистры, поскольку 
эти регистры могли быть установлены один раз при запуске программы (компиля- 
торы языков программирования делают это автоматически) и оставаться неизмен- 
ными во время ее выполнения. Очень просто! 


Все становилось немного сложнее, когда размер данных программы превышал 
64 Кбайт. Применение сегментных регистров позволило создать стройное аппарат- 
ное решение, но их использование доставляло много проблем разработчикам про- 
граммного обеспечения. Компиляторы для архитектуры 8088 различали указатели 
типа пеаг и /аг. Указатель типа иеаг представлял собой 16-битное смещение от ба- 
зового адреса текущего сегментного регистра. Указатель типа /аг содержал 32 бита 
адресной информации: 16-битное значение регистра сегмента и 16-битное смеще- 
ние. Указатели типа /аг потребляли дополнительные 16 бит памяти данных, а также 
требовали дополнительного времени на обработку. 


Для одной операции доступа к памяти с использованием указателя типа {ат требо- 
валось выполнить следующие шаги: 


1. Сохранить текущее содержимое сегментного регистра во временной ячейке па- 
МЯТи. 


2. Загрузить новое значение сегмента в регистр. 


3. Выполнить операцию доступа к данным (чтение или запись, по мере необходи- 
мости) с использованием смещения от базового адреса сегмента. 


4. Восстановить исходное значение сегментного регистра. 


При использовании указателей типа /а’ можно было объявлять объекты данных 
(например, массив символов, представляющих документ в текстовом редакторе) 
размером до 64 Кбайт. Если требовалась более крупная структура, нужно было 
придумать, как разбить ее на фрагменты размером не более 64 Кбайт и управлять 
ими самостоятельно. В результате таких манипуляций с сегментным регистром 
программы, которые требовали широкого доступа к элементам данных размером 
более 64 Кбайт, становились довольно сложными, что вело к увеличению размера 
кода и замедлению его выполнения. 


На материнской плате [ВМ РС располагался разъем для предлагаемого отдельно 
сопроцессора ше 8087 для вычислений с плавающей запятой. Разработчики 8087 
изобрели форматы данных и правила обработки для 32- и 64-разрядных чисел с 
плавающей запятой, которые были закреплены в 1985 г. в виде стандарта ТЕЕЕ 754 
для вычислений с плавающей запятой — этот стандарт находит практически уни- 
версальное применение и сегодня. Сопроцессор 8087 может выполнять около 
50 000 операций с плавающей запятой в секунду. Мы подробно рассмотрим их в 
главе 9. 


Микропроцессоры |т1е! 80286 и 80386 


Второе поколение компьютеров 1ВМ РС — РС АТ — было выпущено в 1984 г. АТ 
означало Адуапсе4 Тесвпоору (улучшенная технология) и указывало на некото- 
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рые существенные улучшения по сравнению с оригинальным ПК, которые в основ- 
ном были результатом использования процессора ие] 80286. 


Как и 8088, 80286 был 16-разрядным процессором, который поддерживал обратную 
совместимость с 8088: код 8088 можно было выполнять на 80286 без изменений. 
80286 имел 16-разрядную шину передачи данных и 24 адресные строки, поддержи- 
вающие адресное пространство размером 16 Мбайт. 16-разрядная внешняя шина 
данных повышала скорость доступа к данным по сравнению с 8-разрядной шиной 
процессора 8088. Скорость выполнения инструкций (за такт процессора) была при- 
мерно в два раза выше, чем у 8088, во многих приложениях. Это означало, что при 
той же тактовой частоте 80286 мог работать в два раза быстрее, чем 8088. Процес- 
сор оригинального РС АТ имел тактовую частоту 6 МГц, а его более поздняя вер- 
сия работала на частоте 8 МГц. Скорость выполнения инструкций на 80286 с такто- 
вой частотой 6 МГц достигала примерно 0,9 млн инструкций в секунду, что было 
примерно в три раза выше, чему 8088. 


В 80286 был реализован режим защищенной виртуальной адресации, предназна- 
ченный для поддержки многопользовательских операционных систем и многоза- 
дачности. 


В защищенном режиме процессор обеспечивал защиту памяти, чтобы гарантировать, 
что программы одного пользователя не окажут влияния на работу операционной 
системы или программ других пользователей. Это революционное технологическое 
достижение в области персональных компьютеров оставалось мало используемым 
в течение многих лет главным образом из-за непомерно высокой стоимости добав- 
ления в компьютерную систему достаточного объема памяти, чтобы сделать ее по- 
лезной в многопользовательском, многозадачном контексте. 


После 80286 следующее поколение линейки процессоров х86 было представлено 
моделью 80386, выпущенной в 1985 г. 80386 был 32-разрядным процессором с 
поддержкой 32-разрядной линейной модели памяти в защищенном режиме. Линей- 
ная модель позволяла программистам напрямую обращаться к 4 Гбайт памяти, не 
требуя манипуляций с сегментными регистрами. В 1986 г. компания Сотраа пред- 
ставила совместимый с 1ВМ РС персональный компьютер на базе 80386, названный 
Ое5КРго. ОезКРго поставляется с версией ОС М!сгозой У//т4до\з, ориентированной 
на архитектуру 80386. 


Процессор 80386 в значительной степени поддерживал обратную совместимость с 
процессорами 80286 и 8088. Архитектура, реализованная в 80386, остается текущей 
стандартной архитектурой семейства х86. Мы подробно обсудим ее в главе [0. 


Начальная версия 80386 имела тактовую частоту 33 МГц, а скорость выполнения 
достигала примерно 11,4 млн инструкций в секунду. Современные реализации ар- 
хитектуры х86 работают в несколько сотен раз быстрее, чем исходная версия, за 
счет более высокой тактовой частоты, повышения производительности, включая 
широкое использование многоуровневой кеш-памяти, и более эффективного вы- 
полнения инструкций на аппаратном уровне. Мы рассмотрим преимущества кеш- 
памяти в главе 8. 
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'РИопе 


В 2007 г. Стив Джобс представил миру 1РВопе — человечество тогда и понятия не 
имело о том, какую пользу можно было извлечь из такого устройства. 1РВопе был 
создан на основе предыдущих революционных достижений Арр!е Сотрщег, вклю- 
чая компьютер Масшюз$В, выпущенный в 1984 г., и музыкальный плеер 1Ро4, поя- 
вившийся в 2001 г. 1РВопе сочетал в себе функции 1Ро4, мобильного телефона и 
компьютера с выходом в Интернет. 


В 1РБопе была упразднена аппаратная клавиатура, которая была распространена на 
смартфонах того времени, ее заменил сенсорный экран, способный отображать эк- 
ранную клавиатуру или любой другой тип пользовательского интерфейса. Помимо 
прикосновений для выбора символов на клавиатуре и нажатия кнопок экран под- 
держивал жесты несколькими пальцами, которые позволяли выполнять такие дей- 
ствия, как масштабирование фотографий. 


1Рвопе работал под управлением операционной системы ОЗ Х; та же ОС использо- 
валась на флагманских компьютерах МасшюзЙ того времени. 


Такое решение сразу же позволило 1Рвопе поддерживать широкий спектр приложе- 
ний, уже разработанных для Мас, а разработчики ПО получили возможность быст- 
ро внедрять новые приложения, адаптированные для 1РБопе, после того, как Арре 
разрешила стороннюю разработку приложений. 


1РБопе | был оснащен 3,5-дюймовым экраном с разрешением 320х480 пикселов. 
Он имел толщину 11,6 мм (тоньше, чем у других смартфонов), встроенную 2-мега- 
пиксельную камеру и весил 136 г. Когда пользователь подносил телефон к уху, 
датчик приближения обнаруживал это и отключал подсветку экрана и восприятие 
касаний экрана на время разговора. В устройстве также был предусмотрен датчик 
внешней освещенности для автоматической настройки яркости экрана и акселеро- 
метр, который определял выбор портретной или альбомной ориентации экрана. 


1Рвопе 1 содержал 128 Мбайт оперативной памяти и 4, 8 или 16 Гбайт флеш-памяти 
и поддерживал стандарт глобальной системы мобильной связи (С1оБа] Зу$ет Юг 
Моше соттитсайноп$, ОЗМ), \УЛ-Е1 (802.1 16/2) и Вшеюо!. 


В отличие от обилия общедоступной информации об [ВМ РС, компания АррЁе, как 
правило, не раскрывала детали архитектуры 1Рвопе. Арре не опубликовала ника- 
кой информации о процессоре или других внутренних компонентах первого 1РВопе, 
просто назвав его закрытой системой. 


Несмотря на отсутствие официальной информации от Арре, нашлись энтузиасты, 
которые разобрали различные модели 1РБопе и попытались идентифицировать 
компоненты телефона и взаимосвязи между ними. Исследователи программного 
обеспечения разработали различные тесты, которые пытались определить конкрет- 
ную модель процессора и других цифровых устройств, установленных в !РВопе. 
Такие усилия по обратной разработке подвержены ошибкам, поэтому описания ар- 
хитектуры 1РВопе в этом разделе следует воспринимать с определенной долей скеп- 
тицизма. 
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В 1РБопе 1 был установлен выпускаемый компанией Затзипе 32-разрядный про- 
цессор АКМИ1 с тактовой частотой 412 МГц. АКМИ1 был улучшенным вариантом 
процессоров АКМ предыдущего поколения и включал 8-ступенчатый конвейер об- 
работки инструкций и поддержку модели обработки с одним потоком инструкций 
и множеством потоков данных (5112]е шзбисНоп, ти[аре даа, $ПМО) для улуч- 
шения качества звука и видео. Архитектуру процессора АКМ мы подробно обсу- 
дим в главе [0. 


Питание 1Рвопе 1 обеспечивал литий-ионный полимерный аккумулятор напряже- 
нием 3,7 В. Замена аккумулятора не предусматривалась, и, по оценкам Арр!е, после 
400 циклов зарядки и разрядки он должен был потерять около 20% своей первона- 
чальной емкости. Арре заявила о том, что устройство будет работать до 250 часов 
в режиме ожидания и до 8 часов в режиме разговора без подзарядки. 


Через 6 месяцев после появления 1Рвопе журнал "Тите" назвал 1РБопе "Изобретени- 
ем года" за 2007 г. В 2017 г. "Тите" составил рейтинг 50 самых влиятельных уст- 
ройств всех времен. 1Р|вопе возглавил этот список. 


В следующем разделе мы рассмотрим взаимосвязь развития технологических дос- 
тижений в области вычислительной техники и лежащих в их основе физических 
ограничений интегральных схем на базе кремния. 


Закон Мура 


Для тех, кто работает в быстро развивающейся области компьютерных технологий, 
составление планов на будущее является сложной задачей. Это справедливо неза- 
висимо от того, ставите ли вы перед собой цель спланировать собственную карьеру 
или разработать оптимальный график инвестиций в исследования и разработки для 
крупной полупроводниковой корпорации. Никто и никогда не может быть полно- 
стью уверен, каким будет следующий технологический скачок, какие из его по- 
следствий повлияют на отрасль и пользователей или когда он произойдет. Один из 
подходов, который оказался полезным в этих сложных условиях, заключается в 
разработке эмпирического правила или закона, основанного на опыте. 


В 1957 г. Гордон Мур стал соучредителем компании ЕаисЬ4 Зеписопдисог, а поз- 
же занимал посты председателя Совета директоров и генерального директора |. 
В 1965 г. Мур опубликовал в журнале "ЕЧесопис$" статью, где он предложил свой 
прогноз изменений, которые произойдут в полупроводниковой промышленности в 
течение следующих 10 лет. В статье он отметил, что количество дискретных ком- 
понентов, таких как транзисторы, диоды и конденсаторы, которые можно было раз- 
местить на одном чипе, удваивалось примерно каждый год, и что эта тенденция, 
вероятно, сохранится в течение следующих 10 лет. Эта формула удвоения стала 
известна как закон Мура. Это не был научный закон наподобие закона всемирного 
тяготения. Скорее это был результат наблюдения за историческими тенденциями, 
и Мур посчитал, что такая формулировка может определенным образом прогнози- 
ровать будущее. 
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Для тех десяти лет закон Мура оказался впечатляюще точным. В 1975 г. он пере- 
смотрел прогнозируемый темп роста на следующее десятилетие, предположив, что 
количество компонентов на интегральной схеме будет удваиваться каждые два го- 
да, а не ежегодно. Этот темп выдерживался десятилетиями — примерно до 2010 г. 
В последние годы темпы роста несколько снизились. В 2015 г. Брайан Кржанич, 
генеральный директор корпорации [{@е|, заявил, что темпы роста компании замед- 
ляются и удвоение достигается примерно каждые два с половиной года. 


Несмотря на то что срок удвоения плотности интегральных схем увеличивается, 
нынешние темпы роста представляют собой феноменальный прогресс, который, 
как можно ожидать, продолжится и в будущем, но не так быстро, как раньше. 


Закон Мура на протяжении десятилетий зарекомендовал себя как надежный инст- 
румент для оценки деятельности полупроводниковых компаний. 


Компании использовали его для постановки целей по производительности своих 
продуктов и для планирования своих инвестиций. Сравнивая увеличение плотности 
интегральных схем для продуктов компании с предыдущими значениями и с пока- 
зателями других компаний, руководители полупроводниковых компаний и отрас- 
левые аналитики могут оценивать и квалифицировать эффективность компании. 
Результаты такого анализа напрямую повлияли на решения об инвестировании в 
огромные новые заводы по производству интегральных схем и достижении новых 
уровней интеграции за счет уменьшения размеров элементов. 


За десятилетия, прошедшие с момента появления ВМ РС, возможности однокри- 
стальных микропроцессоров значительно расширились. Процессоры современных 
поколений в сотни раз быстрее, изначально работают с 32- и 64-битными данными, 
имеют гораздо больше встроенной памяти и раскрывают намного больше функ- 
циональных возможностей, и все это — на одной интегральной схеме. 


Эти усовершенствования стали возможными благодаря увеличению плотности 
размещения полупроводниковых элементов, как предсказывает закон Мура. Тран- 
зисторы меньшего размера работают на более высоких тактовых частотах из-за бо- 
лее коротких соединений между элементами схемы. Кроме того, меньшие транзи- 
сторы, очевидно, позволяют реализовать больше функций на заданной площади 
кристалла. Из-за меньших размеров и расстояний между соседними компонентами 
транзисторы потребляют меньше энергии и выделяют меньше тепла. 


В законе Мура не было ничего магического. Это было лишь наблюдение за тенден- 
циями того времени. Одной из тенденций был неуклонный рост размеров полупро- 
водниковых кристаллов. Это стало результатом улучшения производственных про- 
цессов, которые снизили плотность дефектов, что позволило получить приемлемый 
выход продукции с более крупными кристаллами интегральных схем. Другой тен- 
денцией было постоянное уменьшение размера самых маленьких компонентов, ко- 
торые можно было надежно изготовить в составе схемы. Последняя тенденция бы- 
ла обусловлена тем, что Мур называл "изобретательностью" разработчиков схем, 
которая выражалась во все более эффективном и действенном использовании рас- 
тущего числа схемных элементов, размещаемых на кристалле. 
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Традиционные процессы производства полупроводников начали приближаться к 
физическим пределам, которые в конечном счете затормозят рост, предсказанный 
законом Мура. Наименьшие элементы современных коммерчески доступных инте- 
гральных схем имеют размер около 5 нанометров (нм). Для сравнения: типичный 
человеческий волос имеет толщину около 50 000 нм, а молекула воды (одна из са- 
мых маленьких молекул) имеет размер 0,28 нм. Существует предел, ограничиваю- 
щий дальнейшее уменьшение схемных элементов, т. к. их размеры приближаются к 
атомарному масштабу. 


В дополнение к проблеме создания надежных элементов из небольшого количества 
молекул начинают проявляться и другие физические эффекты, такие как дифракци- 
онный предел Аббе, которые могут стать серьезным препятствием для производства 
одноразрядных схем нанометрового масштаба. 


Мы не будем вдаваться в подробности этих явлений, достаточно знать, что неук- 
лонное увеличение плотности компонентов интегральных схем, которое продолжа- 
лось в течение десятилетий в соответствии с законом Мура, в ближайшие годы ста- 
нет намного труднее поддерживать. 


Это не означает, что мы "застрянем" на уровне процессоров, которые будут во мно- 
гом аналогичны тем, что сейчас доступны на рынке. Несмотря на замедление роста 
плотности транзисторов, производители полупроводников используют ряд альтер- 
нативных методов для дальнейшего увеличения мощности вычислительных уст- 
ройств. Одним из подходов является специализация, при которой схемы разраба- 
тываются для высокоэффективного решения задач определенной категории, а не 
просто для удовлетворительного выполнения широкого круга задач. 


Графические процессоры (2тарЬ1с$ ргосеззштр ип, СОРИ) являются превосходным 
примером специализации. Графические процессоры первого поколения были наце- 
лены исключительно на повышение скорости построения трехмерных графических 
сцен, в основном для использования в видеоиграх. Расчеты, необходимые для по- 
строения трехмерной сцены, хорошо определены и должны применяться к тысячам 
пикселов для создания одного кадра. Этот процесс повторяется для каждого после- 
дующего кадра, а чтобы обеспечить удовлетворительное взаимодействие с пользо- 
вателем, кадры должны перерисовываться с частотой 60 Гц или выше. Требова- 
тельный к вычислительным ресурсам и циклический характер этой задачи идеально 
подходит для ускорения с помощью аппаратного распараллеливания. Несколько 
вычислительных модулей внутри графического процессора одновременно выпол- 
няют практически одни и те же вычисления с разными входными данными для по- 
лучения отдельных потоков выходных данных. Эти выходные потоки объединяются 
для создания полной сцены. Архитектура современных графических процессоров 
была усовершенствована для поддержки других областей применения вычислений, 
таких как обучение нейронных сетей на больших объемах данных. Архитектуры 
графических процессоров будут подробно описаны в главе 6. 


В ближайшие годы тенденция, описанная законом Мура, продемонстрирует при- 
знаки ослабления. Так какие достижения могут компенсировать этот спад, чтобы 
запустить следующий раунд инноваций в компьютерных архитектурах? Сегодня 
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мы не знаем наверняка, но некоторые привлекательные варианты в настоящее вре- 
мя пристально изучаются. Квантовые вычисления — один из примеров таких тех- 
нологий. Мы рассмотрим эту технологию в главе 17. 


Квантовые вычисления используют свойства субатомных частиц для обработки 
данных таким образом, который недоступен для традиционных компьютеров. Ос- 
новным элементом квантовых вычислений является кубит, или квантовый бит. Ку- 
бит подобен обычному двоичному биту, но помимо представления состояний 0 и 1, 
кубиты могут достигать состояния, являющегося суперпозицией (или смесью) со- 
стояний 0 и 1. При измерении выходное значение кубита всегда будет равно 0 или 1, 
но вероятность получения любого из выходных значений зависит от квантового 
состояния кубита перед считыванием. Для того чтобы воспользоваться уникальны- 
ми возможностями квантовых вычислений, необходимы специализированные алго- 
ритмы. 


Другая перспективная возможность состоит в том, что следующий значительный 
технологический прорыв в вычислительных устройствах будет связан с чем-то, 
о чем мы либо не думали, либо, если мы думали об этом, то могли сразу отбросить 
эту идею как нереалистичную. 1Рвопе, обсуждавшийся в предыдущем разделе, яв- 
ляется примером инновационного продукта, создавшего новую категорию, — это 
устройство произвело революцию в личном общении и открыло новые способы 
использования Интернета. Следующим крупным достижением может быть новый 
тип продукта, удивительная новая технология или некое сочетание продукта и тех- 
нологии. Прямо сейчас мы не знаем, что это будет и когда это произойдет, но мы с 
уверенностью можем сказать, что такие изменения грядут. 


В следующем разделе представлены некоторые фундаментальные концепции циф- 
ровых вычислений, которые необходимо понять, прежде чем мы углубимся в циф- 
ровые схемы и детали архитектуры современных компьютеров в следующих главах. 


Архитектура компьютеров 


Описания ряда ключевых архитектур из истории вычислительной техники, пред- 
ставленные в предыдущих разделах этой главы, содержали некоторые знакомые 
или незнакомые вам термины. В этом разделе будут представлены концептуальные 
структурные элементы, которые используются для создания современных процес- 
соров и связанных с ними компьютерных подсистем. 


Представление чисел уровнями напряжения 


Одной из общепринятых особенностей современных компьютеров является ис- 
пользование уровней напряжения для указания значений данных. Обычно распо- 
знаются только два уровня напряжения: низкий и высокий. Низкому уровню часто 
присваивают значение 0, а высокому уровню — значение 1. 


Напряжение в любой точке цепи (цифровой или иной) имеет аналоговую природу и 
может принимать любое значение в пределах своего рабочего диапазона. При пере- 
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ходе с низкого уровня на высокий или обратно напряжение должно проходить че- 
рез все промежуточные уровни. В контексте цифровых схем переходы между низ- 
кими и высокими уровнями происходят быстро, и эти схемы проектируются таким 
образом, чтобы не реагировать на напряжения между высоким и низким уровнями. 


Двоичные и шестнадцатеричные числа 


Схемы внутри процессора ни в каком из возможных смыслов не работают напря- 
мую с числами. Схемные элементы процессора подчиняются законам электричест- 
ва и электроники и просто реагируют на поступающие входные сигналы. Входные 
сигналы, которые управляют этими действиями, порождаются кодом, разработан- 
ным программистами, и данными, предоставленными в качестве входных данных 
для программы. Интерпретация результатов работы программы, например чисел в 
электронной таблице или символов в программе обработки текстов, — это чисто 
человеческая интерпретация, придающая значение результату электронных взаи- 
модействий внутри процессора. Решение присвоить 0 низкому напряжению и | вы- 
сокому напряжению является первым шагом в процессе этой интерпретации. 


Наименьшей единицей информации в цифровом компьютере является двоичная 
цифра, называемая битом, которая представляет собой отдельный элемент данных, 
содержащий значение 0 или 1. Несколько битов можно сгруппировать, чтобы обес- 
печить представление большего диапазона значений. Байт состоит из 8 битов, объ- 
единенных в одно значение. Байт — это наименьшая единица информации, которая 
может быть прочитана или записана в память большинством современных процес- 
соров. Некоторые компьютеры прошлого и настоящего используют разное количе- 
ство битов для наименьшего адресуемого элемента данных, но 8-битный байт пред- 
ставляет наиболее распространенный размер. 


Один бит может принимать два значения: 0 или 1. Два сгруппированных бита мо- 
гут принимать четыре значения: 00, 01, 10 и 11. Три бита могут принимать восемь 
значений: 000, 001, 010, 011, 100, 101, 110 и 111. В целом группа из и битов может 
принимать 2” значений. Таким образом, 8-битный байт может представлять 2° или 
256 уникальных значений. 


Когда дело доходит до выполнения арифметических операций, двоичный формат 
представления чисел не является предпочтительным для большинства людей. Рабо- 
та с числами, представленными в виде 11101010, может быть достаточно сложной и 
подверженной ошибкам, особенно если речь идет о манипулировании 32- и 64-битны- 
ми значениями. Для того чтобы упростить работу с этими числами, часто вместо них 
используют шестнадцатеричные числа. Термин "шестнадцатеричный" (Веха4есита]) 
часто сокращают до йех. 


В шестнадцатеричной системе счисления двоичные числа разделены на группы по 
четыре бита. При 4 битах в группе количество возможных значений равно 2% или 
16. Первые десять из этих 16 чисел обозначаются цифрами от 0 до 9, а оставшиеся 
шесть — буквами от А до Е. В табл. 1.1 показаны первые 16 двоичных значений, 
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начиная с 0, вместе с соответствующей шестнадцатеричной цифрой и десятичным 
эквивалентом двоичного и шестнадцатеричного значений. 


Таблица 1.1. Двоичные, шестнадцатеричные и десятичные числа 


ИИ 
СТО ПО ОИ ПО 
С ПО ПЕ 
ОС ПО ПОС 
О ООО ОО ПО 
О ОО ОИ ПОС 
О ОО О ПО 
О О И ПО 
во 


Двоичное число 11101010 можно представить более компактно, разбив его на две 
группы по четыре бита (1110 и 1010) и записав их в виде шестнадцатеричных цифр 
ЕА. Группу из четырех битов иногда называют полубайтом, т. е. половиной байта. 
Двоичные числа могут принимать только два значения, поэтому двоичная система 
является системой счисления с основанием 2. Шестнадцатеричные числа могут 
принимать 16 значений, поэтому шестнадцатеричная система счисления имеет ос- 
нование 16. Десятичные числа могут иметь 10 значений, поэтому десятичная сис- 
тема имеет основание 10. 


> 


л 


При работе с различными системами счисления легко запутаться. Является ли чис- 
ло, записанное как 100, двоичным, шестнадцатеричным или десятичным? Без до- 
полнительной информации ответить на этот вопрос невозможно. Различные языки 
программирования и учебники использовали разные подходы к устранению подоб- 
ной двусмысленности. В большинстве случаев десятичные числа не имеют допол- 
нительных обозначений, поэтому число, записанное как 100, обычно является деся- 
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тичным. В языках программирования, таких как С и С++, перед шестнадцатерич- 
ными числами ставится обозначение @х, поэтому число в виде 0х10е представляет 
собой 100 в шестнадцатеричном формате. В языках ассемблера для обозначения 
шестнадцатеричных чисел могут использоваться либо префикс $, либо суффикс н. 
Использование двоичных значений в программировании менее распространено — 
в основном это обусловлено тем, что шестнадцатеричные значения предпочтитель- 
нее из-за их компактности. Некоторые компиляторы поддерживают использование 
@ь в качестве префикса для двоичных чисел. 


ПРЕДСТАВЛЕНИЕ ШЕСТНАДЦАТЕРИЧНОГО ЧИСЛА 


сти от контекста, используется либо префикс $, либо суффикс Н. Суф- 
фикс Ь обозначает двоичные числа, а отсутствие префикса или суффик- 
са указывает на десятичные числа. 


2-4 В этой книге для представления шестнадцатеричных чисел, в зависимо- 


Биты в двоичном числе нумеруются индивидуально, причем бит 0 в крайней пра- 
вой позиции является наименее значащим битом. Номера битов увеличиваются по 
величине справа налево, вплоть до самого старшего бита в крайней левой позиции. 


Некоторые примеры помогут прояснить эти правила. В табл. 1.1 в двоичном значе- 
нии 0001Ъ (1 в десятичном формате) для бита с номером 0 установлена 1, а осталь- 
ные три бита равны 0. Для 00106 (2 в десятичном формате) бит 1 установлен, а ос- 
тальные биты обнулены. Для 0100Ъ (4 в десятичном формате) бит 2 установлен, 
а остальные биты обнулены. 


УСТАНОВЛЕННЫЙ БИТ И ОБНУЛЕННЫЙ БИТ 


2 Установленный бит имеет значение 1. Обнуленный бит имеет значение 0. 


8-битный байт может принимать значения от $001 до $ЕЕ, эквивалент десятичного 
диапазона 0—255. При выполнении сложения на уровне байтов результат может 
превышать 8 битов. Например, добавление $01 к $ЕЁ дает результат $100. При ис- 
пользовании 8-битных регистров это означает операцию переноса в девятый бит, 
которая должна соответствующим образом обрабатываться аппаратными средства- 
ми процессора и программным обеспечением, выполняющим сложение. 


В беззнаковой арифметике вычитание $01 из $00 дает значение $ЕЕ, т. е. выполня- 
ется циклический переход к значению $ЕЕ. В зависимости от выполняемых вычис- 
лений это может быть желаемым результатом, а может и не быть им. Опять же, ап- 
паратные средства и программное обеспечение процессора должны обработать эту 
ситуацию, чтобы прийти к желаемому результату. 
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При необходимости отрицательные значения могут быть представлены с помощью 
двоичных чисел. Наиболее распространенным форматом чисел со знаком в совре- 
менных процессорах является дополнительный код. При его использовании 
8-битные числа со знаком охватывают диапазон от —128 до 127. Старший бит зна- 
чения в дополнительном коде является битом знака: 0 в этом бите представляет по- 
ложительное число, а | — отрицательное число. Отрицание числа в дополнитель- 
ном коде (умножение на —1) выполняется путем инвертирования всех его битов, 
добавления | и игнорирования переноса. Инверсия бита означает изменение со- 
стояния обнуленного бита на 1, а установленного бита — на 0. Ряд пошаговых 
примеров отрицания 8-битных чисел со знаком приведен в табл. 1.2. 


Таблица 1.2. Примеры операции отрицания 


значение значение единицы р — отрицания 
о | ожжь | пы | вю |0 
[т | жж | птиь [ шить [а 
[эт | апить | ожвюь [ южюь | 97 


Отрицание 0 возвращает 0, как и следовало ожидать с точки зрения математики. 


АРИФМЕТИКА ДОПОЛНИТЕЛЬНОГО КОДА 


На уровне битов арифметика дополнительного кода идентична беззна- 
и ковой арифметике. Манипуляции, связанные со сложением и вычитани- 
\ ем, одинаковы независимо от того, являются ли входные значения зна- 
ковыми или беззнаковыми. Интерпретация результата как знакового 
или беззнакового полностью зависит от намерения пользователя. 


В табл. 1.3 показано соответствие двоичных значений от 000000006 до 111111116 
значениям со знаком в диапазоне от—128 до 127 и беззнаковым значениям от 0 до 255. 


Таблица 1.3. Знаковые и беззнаковые 8-битные числа 


000000006 
000000016 


БЕСТ ББ ОИСИ 
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Таблица 1.3 (окончание) 


3 
2 
1 


Знаковые и беззнаковые представления двоичных чисел распространяются на более 
крупные целочисленные типы данных. 16-битные значения могут представлять це- 
лые числа без знака от 0 до 65 535 и целые числа со знаком в диапазоне от —32 768 
до 32 767. В современных процессорах и языках программирования обычно дос- 
тупны 32-битные, 64-битные и даже более крупные целочисленные типы данных. 


И 


Микропроцессор 6502 


В этом разделе представлена процессорная архитектура, являющаяся относительно 
простой по сравнению с более мощными современными процессорами. 


Цель такого подхода — представление некоторых базовых концепций, общих для 
широкого круга процессоров, от бюджетных микроконтроллеров до сложных мно- 
гоядерных 64-разрядных процессоров. 


Процессор 6502 был представлен компанией МОЗ$ Тесвпо]озу в 1975 г. Он нашел 
широкое применение в игровых консолях от Айап и Мепдо, а также в компьюте- 
рах, продаваемых Соттодоге и Арре. Различные версии процессора 6502 по- 
прежнему широко используются во встроенных системах и сегодня — согласно 
некоторым оценкам, с 2018 г. их выпущено от 5 до 10 млрд (да-да, миллиардов). 
В поп-культуре, и робот Бендер из "Футурамы", и Т-800 из "Терминатора", судя по 
ряду кадров, работали на 6502. 


Как и многие ранние микропроцессоры, 6502 использовал источник питания на- 
пряжением $ вольт (В) постоянного тока. В таких схемах низкий уровень сигна- 
ла — это любое напряжение от 0 до 0,8 В, а высокий уровень — любое напряжение 
от 2 до 5 В. Напряжения между этими диапазонами возникают только при перехо- 
дах от низкого к высокому и от высокого к низкому уровню. Низкий уровень сиг- 
нала определяется как логический 0, а высокий уровень сигнала — как логическая 1. 
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В главе 2 будут подробно рассмотрены электронные схемы, используемые в циф- 
ровой электронике. 


Длина слова процессора определяет размер основного элемента данных, с кото- 
рым работает процессор. Длина слова процессора 6502 равна 8 битам. Это означает, 
что 6502 считывает и записывает данные в память по 8 бит за раз и хранит данные в 
8-разрядных регистрах. 


Для памяти программ и памяти данных используется одно и то же адресное про- 
странство, а доступ к памяти 6502 осуществляется по одной шине. Как ив ш] 8088, 
в 6502 реализована архитектура фон Неймана. Этот процессор имеет 16-разрядную 
адресную шину, позволяющую адресовать 64 Кбайт памяти. 


1 Кбайт содержит 2'° или 1024 байта. Количество уникальных двоичных комбина- 
ций для 16 адресных строк равно 25, что позволяет получить доступ к 65 536 ячей- 
кам памяти с байтовой организацией. Обратите внимание, что способность устрой- 
ства адресовать 64 Кбайт не означает, что каждой из этих ячеек должна 
соответствовать физическая память. Компьютер Соттодоге У!С-20, основанный 
на процессоре 6502, содержал всего 5 Кбайт ОЗУ и 20 Кбайт ПЗУ. 


Процессор 6502 содержит внутренние области хранения данных, называемые реги- 
страми. Регистр — это место в логическом устройстве, в котором слово информа- 
ции может храниться и обрабатываться во время вычислений. Типичный процессор 
содержит небольшое количество регистров для временного хранения значений 
данных и выполнения таких операций, как сложение или вычисления адреса. 


На рис. 1.1 показана структура регистров 6502. Процессор содержит пять 8-разряд- 
ных регистров (А, Х, У, Риз) и один 16-разрядный регистр (РС). Цифры над каж- 
дым регистром указывают номера битов на каждом из концов регистра. 


7 0 
о ИИЯИЙ 
7 0 
НИИ 
7 0 


7 


0 
ММ 2]в]5] [2 С 
0 


— 


15 0 


Рис. 1.1. Набор регистров процессора 6502 


Каждый из регистров А, Х и У может служить хранилищем общего назначения. 
Инструкции программы могут загружать значение в один из этих регистров и после 
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выполнения нескольких других инструкций использовать сохраненное значение 
для какой-либо цели, если промежуточные инструкции не изменили содержимое 
этого регистра. Регистр А — это единственный регистр, поддерживающий выпол- 
нение арифметических операций. Регистры Х и У, но не регистр А, можно исполь- 
зовать в качестве индексных регистров при вычислении адресов памяти. 


Регистр Р содержит флаги процессора. Каждый бит в этом регистре имеет уникаль- 
ное назначение, за исключением бита, помеченного 1. Бит 1 не используется и мо- 
жет быть проигнорирован. Остальные биты в этом регистре называются флагами и 
указывают на определенное состояние или представляют собой параметр конфигу- 
рации. В процессоре 6502 используются следующие флаги. 


» М — флаг отрицательного знака. Этот флаг устанавливается, когда в резуль- 
тате арифметической операции устанавливается бит 7. Используется в знако- 
вой арифметике. 


» \У — флаг переполнения. Он устанавливается, когда операция сложения или 
вычитания над числами со знаком приводит к положительному или отрица- 
тельному переполнению — выходу за пределы диапазона от —128 до 127. 


» В — флаг программного прерывания. Он указывает на выполнение инструк- 
ции ВгеаК (ввк). Этот бит отсутствует в самом регистре Р. Значение флага В 
учитывается только при проверке содержимого регистра Р, сохраненного в 
стеке с помощью инструкции ВВК или прерывания. Флаг В устанавливается 
для того, чтобы при обработке прерываний отличать программное прерыва- 
ние, возникшее в результате выполнения инструкции ВВК, от аппаратного 
прерывания. 


® Ш — флаг десятичного режима. Установка этого флага означает, что арифме- 
тика процессора будет работать в двоично-десятичном (Ыпагу-соде4 4еспта[, 
ВСО) режиме. Режим ВСР используется редко и здесь обсуждаться не будет. 
Следует отметить, что этот режим вычислений с основанием 10 напоминает 
архитектуры аналитической машины Бэббиджа и ЕШАС. 


» [— флаг запрета прерываний. Его установка указывает, что входы прерыва- 
ний (кроме немаскируемого прерывания) обрабатываться не будут. 


е /—_ флаг нуля. Он устанавливается, когда операция приводит к результату, 
равному 0. 


е С — флаг переноса. Он устанавливается, когда арифметическая операция 
приводит к переносу. 


Флаги М, У, Д и С являются наиболее важными флагами в контексте общих вычис- 
лений, включающих циклы, подсчет и арифметику. 


Регистр 3 является указателем стека. В процессоре 6502 стек — это область памя- 
ти, расположенная по адресам от $100 до $1ЕЕ. Эта область длиной 256 байтов 
используется для временного хранения параметров подпрограмм и содержит об- 
ратный адрес при вызове подпрограммы. При запуске системы регистр $ инициали- 
зируется таким образом, чтобы указывать на верхнюю часть этой области. Значения 
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"проталкиваются" в стек с помощью таких инструкций, как РНА, которая помещает в 
стек содержимое регистра А. 


Когда значение помещается в стек, процессор 6502 сохраняет это значение по адре- 
су, указанному регистром $, после добавления фиксированного смещения $100, 
а затем уменьшает значение регистра $ на единицу. Дополнительные значения мо- 
гут быть помещены в стек путем выполнения дополнительных инструкций записи в 
стек. По мере ввода дополнительных значений стек в памяти растет в направлении 
вниз. Программы должны следить за тем, чтобы не превышать зафиксированный 
для стека размер в 256 байт при загрузке в него данных. 


Хранящиеся в стеке данные должны извлекаться в порядке, обратном тому, в кото- 
ром они были помещены в стек. Стек представляет собой структуру данных, орга- 
низованную по принципу "последним вошел, первым вышел" (1а5ё ш, Вг${ оць 
ЕО). Это означает, что извлекаемое из стека значение — это байт, который был 
добавлен в него последним. Инструкция РЕА увеличивает значение регистра 3 на 1, 
затем копирует значение по адресу, указанному регистром $ (плюс смещение $100), 
в регистр А. 


Регистр РС — это счетчик инструкций. Он содержит адрес инструкции, которая 
должна быть выполнена следующей. В отличие от других регистров, РС имеет раз- 
мер 16 бит, что обеспечивает доступ ко всему адресному пространству процессора 
6502. 


Каждая инструкция состоит из 1-байтового кода операции, для краткости называе- 
мого опкодом (орсоде), и может сопровождаться байтами операндов (от 0 до 2), 
в зависимости от типа инструкции. После выполнения каждой инструкции содер- 
жимое регистра РС обновляется, чтобы указать на инструкцию, следующую за 
только что выполненной. В дополнение к автоматическим обновлениям во время 
последовательного выполнения инструкций регистр РС может быть изменен инст- 
рукциями перехода, ветвления, вызова подпрограмм и возврата из них. 


Набор инструкций микропроцессора 6502 


Теперь рассмотрим набор инструкций процессора 6502. Инструкции — это отдель- 
ные команды процессора, которые выстраиваются в последовательность для вы- 
полнения алгоритма, закодированного программистом. Инструкция содержит дво- 
ичное число, называемое кодом операции (или опкодом), которое сообщает 
процессору, что следует делать при выполнении этой инструкции. 


При желании программисты могут писать код непосредственно с помощью инст- 
рукций процессора. Примеры этого мы увидим позже в этом разделе. Программи- 
сты также могут создавать код на так называемом языке высокого уровня. Затем 
программист использует программный инструмент, называемый компилятором, 
который преобразует высокоуровневый код в последовательность инструкций про- 
цессора (обычно гораздо более длинную). 


В этом разделе мы работаем с кодом, написанным в виде последовательностей ин- 
струкций процессора. Эта форма исходного кода называется языком ассемблера. 
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Каждая инструкция процессора 6502 имеет трехсимвольное мнемоническое обо- 
значение. В исходных файлах языка ассемблера каждая строка кода содержит мне- 
моническое обозначение инструкции, за которым следуют любые операнды, отно- 
сящиеся к этой инструкции. Комбинация мнемонического обозначения и операндов 
определяет режим адресации. Процессор 6502 поддерживает несколько режимов 
адресации, обеспечивая гибкость доступа к данным в регистрах и памяти. Для 
этого введения мы будем работать только с режимом непосредственной адреса- 
ции, в котором сам операнд содержит значение, а не указывает регистр или ячейку 
памяти, содержащую нужное значение. Непосредственному значению предшеству- 
ет символ #. 


В ассемблере процессора 6502 десятичные числа не имеют дополнительных обо- 
значений (48 означает число 48 в десятичном формате), в то время как шестнадца- 
теричным значениям предшествует символ $ ($30 означает число 30 в шестнадца- 
теричном формате, эквивалент 00110000 и десятичного числа 48). Непосредствен- 
ное десятичное значение выглядит как #48, а шестнадцатеричное значение — как 
#$30. 


Некоторые примеры ассемблерного кода продемонстрируют арифметические воз- 
можности процессора 6502. В следующих примерах используются пять инструкций 
6502: 


» |ОАзагружает значение в регистр А; 


е АОС выполняет сложение с учетом переноса (флаг С в регистре Р) в качестве 
дополнительных входных и выходных данных; 


» 5ВС выполняет вычитание с учетом флага С в качестве дополнительных вход- 
ных и выходных данных; 


» ЕС устанавливает флаг С непосредственно; 
» СС обнуляет флаг С непосредственно. 


Так как флаг С предоставляет входные данные для инструкций сложения и вычита- 
ния, перед выполнением инструкции АБС или $8ВС важно убедиться, что он имеет 
правильное значение. Перед выполнением операции сложения флаг С должен быть 
обнулен, чтобы указать на отсутствие переноса из предыдущей операции сложения. 
При сложении многобайтовых значений (например, при работе с 16-, 32- или 64-бит- 
ными числами) перенос, если таковой имеется, будет распространяться от суммы 
одной пары байтов к следующей по мере добавления более значимых байтов. Если 
флаг С установлен при выполнении инструкции дос, то к результату следует доба- 
вить |. После выполнения инструкции АБС флаг С выступает в качестве девятого 
бита результата: если флаг С имеет значение 0, переноса не было, а | указывает на 
то, что из 8-разрядного регистра был выполнен перенос. 


Вычитание с использованием инструкции $8с может немного сбить с толку начи- 
нающих программистов на языке ассемблера процессора 6502. Школьники, изу- 
чающие вычитание, используют технику заимствования при вычитании большей 
цифры из меньшей. В процессоре 6502 флаг С представляет собой признак, проти- 
воноложный заимствованию. Если С имеет значение 1, то заем равен 0, а если 
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С равно 0, то заем равен 1. Выполнение простого вычитания без входящего заимст- 
вования требует установки флага С перед выполнением инструкции $ВС. 


В примерах из табл. 1.4 процессор 6502 используется в качестве калькулятора с 
входными данными, определяемыми в виде непосредственных значений в коде, и с 
результатом, сохраняемым в регистре А. Столбец "Результаты" содержит оконча- 
тельное значение регистра А и состояния флагов М, У, Ди С. 


Таблица 1.4. Последовательности арифметических инструкций процессора 6502 


Последова- | Описание Результаты 
тельность 
инструкций 


8-битное сложение без переноса: обну- 
ление флага переноса, затем загрузка 
непосредственного значения 1 в регистр 
А и добавление к нему 1 


8-битное сложение с переносом: уста- 
новка флага переноса, затем загрузка 
непосредственного значения | в регистр 
А и добавление к нему 1 


8-битное вычитание без заимствования: 
установка флага переноса, затем загрузка 
непосредственного значения 1 в регистр 
А ивычитание из него 1. С = | означает 
отсутствие заимствования 


С 8-битное вычитание с заимствованием: 

ЕДА #1 обнуление флага переноса, затем загруз- 

$ВС #1 ка непосредственного значения 1 в ре- 
гистр А и вычитание из него 1. С = 0 ука- 
зывает на наличие заимствования 

с Положительное переполнение без знака: 

ГОА $ЕЁЕ добавление | к $ЕЕ. С = 1 указывает на 

АОС #1 наличие переноса 


[К 
Е 


ЕС 
с 
5ЕС Отрицательное переполнение без знака: 
ГОА #0 вычитание | из 0. С = 0 указывает на на- 
$ВС #1 личие заимствования 
сес Положительное переполнение со знаком: 
ГОА #$7Е добавление 1 к $7Е. С = 1 указывает на 
АОС #1 наличие положительного переполнения 
со знаком 
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Таблица 1.4 (окончание) 
Последова- |Описание Результаты 


тельность 
инструкций 


5ЕС Отрицательное переполнение со знаком: 

ГОА #$80 вычитание | из $80. С = 1 указывает на 

ВС #1 наличие отрицательного переполнения 
со знаком 


Если у вас под рукой нет компьютера на базе процессора 6502 с ассемблером и от- 
ладчиком, в Интернете доступно несколько его бесплатных эмуляторов, которые 
вы можете запустить в своем веб-браузере. Один превосходный эмулятор доступен 
по адресу ВИрз://5 К Шнек. ИВиЪ.10/еа$у6502/. Зайдите на этот веб-сайт и прокру- 
тите содержимое окна вниз, пока не найдете листинг кода по умолчанию с кнопка- 
ми для сборки и запуска кода 6502. Замените листинг кода по умолчанию группой 
из трех инструкций из табл. 1.4, затем выполните код. 


Для того чтобы изучить действие каждой инструкции в последовательности, ис- 
пользуйте элементы управления отладчика для пошагового выполнения инструк- 
ций и наблюдения за результатом выполнения каждой инструкции в регистрах 
процессора. 


В этом разделе представлено очень краткое введение в процессор 6502 и рассмот- 
рена лишь небольшая часть его возможностей. Одна из целей этого рассмотрения 
состояла в том, чтобы проиллюстрировать сложность решения проблемы переносов 
при выполнении сложения и заимствований при выполнении вычитания. Начиная с 
Чарльза Бэббиджа и заканчивая проектировщиками процессора 6502 и разработчи- 
ками современных вычислительных систем, архитекторы компьютеров находили 
решения задач вычислений и воплощали их в жизнь с применением наилучших 
доступных им технологий. 


Резюме 


Эта глава началась с краткой истории автоматических вычислительных устройств, 
за которой последовал обзор значительных технологических достижений, привед- 
ших к ряду прорывов в вычислительных возможностях. Затем последовало обсуж- 
дение закона Мура с оценкой его применимости в предыдущие десятилетия и воз- 
можных последствий для будущего. Основные понятия компьютерной архитектуры 
были представлены на примере обсуждения регистров и набора инструкций микро- 
процессора 6502. История компьютерной архитектуры увлекательна, и я рекомен- 
дую вам изучить ее более подробно. 


В следующей главе мы познакомимся с цифровой логикой, начиная со свойств ос- 
новных электрических схем и заканчивая проектированием цифровых подсистем, 
используемых в современных процессорах. Вы узнаете об устройстве логических 
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вентилей, триггеров и цифровых схем, включая мультиплексоры, регистры сдвига и 
сумматоры. Эта глава включает введение в языки описания аппаратных средств, 
которые являются специализированными компьютерными языками, применяемыми 
при проектировании сложных цифровых устройств, таких как компьютерные про- 
цессоры. 


Упражнения 


1. Используя свой любимый язык программирования, разработайте модель одно- 
разрядного десятичного сумматора, который работает так же, как сумматор ана- 
литической машины Бэббиджа. Сначала запросите у пользователя две цифры в 
диапазоне 0-9: слагаемое и аккумулятор. Отобразите слагаемое, аккумулятор и 
признак переноса, который изначально равен 0. Выполните серию циклов сле- 
дующим образом: 


1) если слагаемое равно 0, выведите на экран значения слагаемого, аккумулято- 
ра и признака переноса, после чего завершите программу; 


2) уменьшите слагаемое на | и увеличьте значение аккумулятора на 1; 


3) если значение аккумулятора увеличивается с 9 до 0, установите признак пе- 
реноса; 


4) вернитесь к шагу [. 


Протестируйте свой код на примере следующих операций сложения: 0 + 0, 0 + 1, 
1+0, 1+2, 5+5, 9+1 и9-+9. 


2. Создайте для слагаемого, аккумулятора и признаков переноса массивы из 40 де- 
сятичных цифр каждый. Запросите у пользователя два целых десятичных числа 
длиной до 40 цифр каждое. Выполните сложение чисел, цифра за цифрой, ис- 
пользуя циклы, описанные в упражнении /[, и соберите выходные данные в виде 
признаков переноса из позиции каждой цифры в массиве признаков переноса. 
После завершения циклов вставьте переносы и, при необходимости, распростра- 
ните их по цифрам, чтобы завершить операцию сложения. Выводите результаты 
на экран после каждого цикла и по завершении. Проведите тест с теми же сум- 
мами, что и в упражнении 1, а также проверьте суммы 99 +1, 999999 + 1, 
49 + 50 и 50 + 50. 


3. Измените программы упражнений [и 2 так, чтобы реализовать вычитание 
40-значных десятичных значений. Выполняйте заимствование по мере необхо- 
димости. Проверьте программу на примере разностей 0—0, 1-0, 1000000 -Ти 
0 - 1. Каков результат операции 0 - 1? 


4. Язык ассемблера процессора 6502 ссылается на данные в ячейках памяти, ис- 
пользуя значение операнда, содержащее адрес (без символа #, который указыва- 
ет на непосредственное значение). Например, инструкция (ГА $60 загружает в ре- 
гистр А байт, находящийся в памяти по адресу $00. $ТА $01 сохраняет байт из 
регистра А по адресу $01. Адреса могут иметь любое значение в диапазоне от 0 
до $ЕЕЕЕ при условии, что по указанному адресу имеется физическая память и 


Введение в архитектуру компьютеров 57 


этот адрес не используется для каких-либо других целей. С помощью предпоч- 
тительного эмулятора процессора 6502 напишите код на ассемблере 6502 для 
сохранения 16-битного значения по адресам $00—$01, сохраните второе значение 
по адресам $02-$03, затем сложите эти два значения и сохраните результат по 
адресам $04—$05. Обеспечьте распространение переносов между двумя байтами. 
Игнорируйте любой перенос из 16-битного результата. Проверьте код на приме- 
рах $0000 + $0001, $00ЕЕ + $0001 и $1234 + $5678. 


5. Напишите на ассемблере 6502 код для вычитания двух 16-разрядных значений 
способом, аналогичным показанному в упражнении 4. Проверьте код на приме- 
рах $0001 -— $0000, $0001 - $0001, $0100 — $00ЕЕ и $0000 — $0001. Каков резуль- 
тат операции $0000 — $0001? 


6. Напишите на ассемблере 6502 код для сохранения двух 32-разрядных целых чи- 
сел по адресам $00-$03 и $04-$07, а затем сложите их, сохранив результаты по 
адресам $08—$0В. Используйте циклическую конструкцию, включающую метку 
и команду ветвления, для перебора байтов двух складываемых значений. Найди- 
те в Интернете подробную информацию об инструкциях уменьшения на | и 
ветвления для процессора 6502, а также об использовании меток в языке ас- 
семблера. Подсказка: в этом приложении хорошо работает реализованный в 
процессоре 6502 режим адресации с индексированием нулевой страницы. 


Цифровая логика 


Эта глава основывается на вводных темах, представленных в главе /[, и дает четкое 
представление о цифровых структурных элементах, используемых при проектиро- 
вании современных процессоров и других сложных электронных схем. Мы начнем 
с обсуждения базовых элементов электрических схем. Далее познакомимся с тран- 
зисторами и исследуем их применение в качестве переключающих устройств в 
простых логических вентилях. Затем мы построим из логических вентилей защел- 
ки, триггеры и кольцевые счетчики. После этого путем объединения представлен- 
ных ранее устройств создадим более сложные компоненты процессора, такие как 
регистры и сумматоры. Также здесь будет введено понятие последовательностной 
логики, т. е. логики, построенной на информации о состоянии, которая меняется со 
временем. Глава заканчивается введением в языки описания аппаратных средств, 
представляющие предпочтительный метод проектирования сложных цифровых 
устройств. 
В этой главе будут рассмотрены следующие темы: 

е электрические схемы, 

» транзистор; 

» логические вентили; 

» защелки; 

е триггеры; 

» регистры; 

» сумматоры; 

» синхронизация; 

® последовательностная логика; 


® ЯЗЫКИ ОПИСания аппаратных средств. 


Введение в архитектуру компьютеров 59 


Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 
Вр: //ооБ.сот/РаскКЕРиБ $ т?/Модегп-Сотрщег-АгеВНесиге-апд- 
ОграттаНоп-Зесопд-ЕФ оп. 


Электрические схемы 


Мы начнем эту главу с краткого обзора свойств электрических цепей. 


Проводящие материалы, такие как медь, обладают способностью легко создавать 
электрический ток в присутствии электрического поля. Непроводящие материалы, 
например стекло, резина и поливинилхлорид (ПВХ), препятствуют прохождению 
электрического тока настолько сильно, что их используют в качестве изоляторов 
для защиты электрических проводников от коротких замыканий. В металлах элек- 
трический ток состоит из движущихся электронов. В конструкции резисторов ис- 
пользуются материалы, которые допускают протекание некоторого электрического 
тока, но при этом предсказуемо ограничивают его допустимую величину. 


Связь между силой электрического тока, напряжением и сопротивлением в цепи 
аналогична связи между скоростью потока, давлением и ограничением потока в 
гидравлической системе. Рассмотрим кухонный водопроводный кран: давление в 
трубе, ведущей к крану, заставляет воду течь, когда кран открыт. Если кран приот- 
крыть совсем чуть-чуть, вода будет течь из него тонкой струйкой. Если кран от- 
крыть больше, скорость потока увеличится. Открывание крана эквивалентно 
уменьшению сопротивления потоку воды, протекающему через кран. 


В электрической цепи напряжение соответствует давлению в водопроводе. Элек- 
трический ток, сила которого измеряется в амперах (часто сокращается до "А"), 
соответствует скорости потока воды через трубу и кран. Электрическое сопротив- 
ление соответствует ограничению потока из-за частично открытого крана. 


Величины напряжения, тока и сопротивления связаны формулой Г = /Щ, где Г— 
напряжение (в вольтах), [ — сила тока (в амперах), К — сопротивление (в омах). 
Другими словами, напряжение на резистивном элементе цепи равно произведению 
протекающего через элемент тока на его сопротивление. Это закон Ома, назван- 
ный в честь Георга Ома, впервые опубликовавшего эту формулу в 1827 г. 


На рис. 2.1 показано простое схематическое представление этого отношения. Стоп- 
ка горизонтальных линий слева обозначает источник напряжения, например акку- 
мулятор или блок питания компьютера. Зигзагообразная форма справа представля- 
ет собой резистор. Линии, соединяющие компоненты схемы, — это провода, 
которые считаются идеальными проводниками. Идеальный проводник обеспечива- 
ет протекание электрического тока без сопротивления. 


Ток, обозначенный буквой /, течет по цепи по часовой стрелке, от положительного 
полюса батареи, через резистор и обратно к отрицательному полюсу батареи. От- 
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рицательная сторона батареи определяется в этой схеме как опорная точка с нуле- 
вым напряжением. 


| — 


-——/ 


ОВ 


Рис. 2.1. Простая резистивная схема 


По аналогии с водопроводной трубой провод под нулевым напряжением представ- 
ляет собой "бассейн с водой". "Насос" (батарея на схеме) забирает воду из бассейна 
и выталкивает ее из верхней части символа батареи в трубу под более высоким 
давлением. Вода течет в виде тока / к крану, обозначенному резистором А справа. 
После прохождения через кран, ограничивающий поток, вода попадает в бассейн, 
где ее можно снова набрать насосом. 


Если мы предположим, что напряжение батареи (т. е. повышение давления в водя- 
ном насосе) постоянно, то любое увеличение сопротивления К уменьшит ток / на 
обратно пропорциональную величину. Например, удвоение сопротивления снизит 
ток вдвое. А удвоение напряжения за счет последовательного включения двух ба- 
тарей, как это делают в фонариках, удвоит ток через резистор. 


В следующем разделе мы познакомимся с транзистором, который служит основой 
для всех современных цифровых электронных устройств. 


Транзистор 


Транзистор — это полупроводниковое устройство, которое, для целей данного об- 
суждения, функционирует как цифровой переключатель. Полупроводник — это 
материал, который занимает промежуточное положение по проводимости между 
хорошими проводниками (такими как медная проволока) и хорошими изоляторами 
(такими как стекло или пластик). При наличии подходящей схемы проводимость 
полупроводникового устройства можно изменять с помощью управляющего входа. 
Используемый таким образом транзистор становится цифровым переключающим 
элементом. 


Операция переключения транзистора электрически эквивалентна переключению 
между очень высоким и очень низким сопротивлением в зависимости от состояния 
сигнала на управляющем входе. Важная особенность переключающих транзисто- 
ров заключается в том, что для управляющего входа не требуется большой ток. 
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Это означает, что малый ток на управляющем входе может управлять коммутацией 
гораздо большего тока, проходящего через транзистор. Ток на выходе одного тран- 
зистора может управлять входами многих других транзисторов. Эта особенность 
очень важна для разработки сложных цифровых схем. 


На рис. 2.2 показано схематическое обозначение транзистора типа я-р-п. Обозначе- 
ние я-р-п относится к строению взаимосвязанных областей кремниевого кристалла, 
составляющих транзистор. В область п кристалла с помощью процесса, называемо- 
го легированием, добавляется материал, увеличивающий количество доступных 
электронов. Область р легируется материалом, уменьшающим количество доступ- 
ных электронов. Транзистор типа я-р-п содержит две области и, между которыми 
находится область р. Три вывода устройства подсоединены к каждой из этих областей. 


Э 
Рис. 2.2. Схематическое обозначение транзистора типа п-р-п 


Коллектор, обозначенный буквой К на рис. 2.2, подсоединен к одной из и областей, 
а эмиттер Э — к другой области и. База Б подсоединена к области р между двумя 
областями п. Коллектор "собирает" ток, а эмиттер "испускает" ток в направлении, 
указанном стрелкой. Вывод базы является управляющим входом. Изменяя напря- 
жение, подаваемое на вывод базы, и, таким образом, изменяя величину тока, проте- 
кающего через базу, можно регулировать ток, входящий через коллектор и выхо- 
дящий через эмиттер. 


Логические вентили 


На рис. 2.3 представлена принципиальная схема транзисторного вентиля НЕ. Пита- 
ние схемы обеспечивает источник напряжением 5 В. Входной сигнал может посту- 
пать от схемы с кнопкой, которая выдает 5 В, когда кнопка нажата, и 0 В, когда 
кнопка отпущена. Резистор А; ограничивает ток, протекающий от клеммы входа к 
выводу базы транзистора, когда на входе высокий уровень (около 5 В). В типичной 
схеме сопротивление резистора К! составляет около 1000 Ом. Резистор К› может 
иметь сопротивление 5000 Ом. Он ограничивает ток, протекающий от коллектора к 
эмиттеру, когда транзистор включен (открыт). 


На клемму входа поступает входное напряжение в диапазоне от 0 до 5 В, но по- 
скольку мы говорим о работе цифровой схемы, нас интересуют только сигналы, 
близкие к 0 В (низкий уровень) или 5 В (высокий уровень). Будем считать, что все 
уровни напряжения между низким и высоким являются переходными при почти 
мгновенных переходах между низким и высоким уровнями. 
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Типичный И-р-п-транзистор имеет напряжение переключения около 0,7 В. Когда на 
клемме входа поддерживается низкое напряжение, например 0,2 В, транзистор за- 
крыт и имеет очень большое сопротивление между коллектором и эмиттером. При 
этом резистор А›, подсоединенный к источнику питания 5 В, обеспечивает высокий 
уровень сигнала на выходе (около 5 В). 


ОВ 


Рис. 2.3. Транзисторный вентиль НЕ 


Когда напряжение входного сигнала превышает 0,7 В и достигает значения из диа- 
пазона от 2 до 5 В, транзистор открывается, и сопротивление между коллектором и 
эмиттером становится очень маленьким. То есть, по сути, клемма выхода соединя- 
ется с проводником 0 В через цепь с сопротивлением, которое намного меньше, 
чем Ао. В результате на клемме выхода действует низкое напряжение, обычно око- 
ло 0,2 В. 


В общем поведение этой схемы можно выразить так: когда на клемме входа высо- 
кий уровень, на клемме выхода наблюдается низкий уровень. Когда на клемме вхо- 
да низкий уровень, на клемме выхода — высокий уровень. Эта функция описывает 
вентиль НЕ, в котором выход является инверсией входа. Поведение этого вентиля 
описано в таблице истинности, представленной в табл. 2.1 (низкому уровню сигна- 
ла соответствует двоичное значение 0, а высокому уровню — значение 1). 


Таблица 2.1. Таблица истинности вентиля НЕ 


Таблица истинности — это табличное представление выходного значения логиче- 
ского выражения как функции всех возможных комбинаций входных данных. Каж- 
дый столбец представляет один вход или выход, выходы показаны в правой части 
таблицы. Каждая строка представляет один набор входных значений вместе с вы- 
ходным значением выражения с учетом этих входных значений. 
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Такие схемы, как вентиль НЕ, показанный на рис. 2.3, настолько распространены в 
цифровой электронике, что им присвоены специальные схематические обозначения 
для построения диаграмм более высокого уровня, представляющих более сложные 
логические функции. 


Символ вентиля НЕ представляет собой треугольник с маленьким кружком на вы- 
ходе (рис. 2.4). 


Вход Выход 


Рис. 2.4. Схематическое обозначение вентиля НЕ 


Треугольник обозначает усилитель, указывая на то, что это устройство превращает 
слабый входной сигнал в более сильный выходной сигнал. Кружок обозначает опе- 
ратор инверсии, который преобразует сигнал в его двоичную противоположность. 


Далее мы рассмотрим некоторые более сложные логические операции, которые 
можно реализовать, опираясь на схему вентиля НЕ. Схема на рис. 2.5 использует 
два транзистора для выполнения операции И с двумя входами: Вход, и Входо. Опе- 
рация И дает на выходе 1, когда на обоих входах |, в иных случаях выход равен 0. 
Резистор А› поддерживает низкий сигнал на выходе, если высокие уровни сигналов 
на входах Вход, и Вход) не отпирают оба транзистора. 


Выход 


ОВ 


Рис. 2.5. Транзисторный вентиль И 


В табл. 2.2 представлена таблица истинности вентиля И. Попросту говоря, выход- 
ной сигнал является истинным (имеет уровень 1), когда оба входа Вход; и Вход» 
являются истинными, и ложным (0) в прочих случаях. 
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Таблица 2.2. Таблица истинности вентиля И 


Вентиль И имеет собственное схематическое обозначение, показанное на рис. 2.6. 


А 


Выхо 
В д 


Рис. 2.6. Схематическое обозначение вентиля И 


Вентиль ИЛИ выдает на выходе |, когда любой из входов, 4 или В, имеет значение 
1, а также когда оба входа имеют значение 1. Таблица истинности вентиля ИЛИ 
приведена в табл. 2.3. 


Таблица 2.3. Таблица истинности вентиля ИЛИ 


Схематическое обозначение вентиля ИЛИ показано на рис. 2.7. 


Выход 
В 


Рис. 2.7. Схематическое обозначение вентиля ИЛИ 


Операция исключающего ИЛИ выдает |, когда только один из входов, 4 и В, имеет 
значение 1. Выход равен 0, когда оба входа равны 0, а также когда оба входа равны 1. 
Таблица истинности вентиля исключающего ИЛИ приведена в табл. 2.4. 


Схематическое обозначение вентиля исключающего ИЛИ показано на рис. 2.8. 
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Таблица 2.4. Тоблица истинности вентиля исключающего ИЛИ 


Выход 
В 


Рис. 2.8. Схематическое обозначение вентиля исключающего ИЛИ 


Каждый из вентилей — И, ИЛИ и исключающее ИЛИ — можно реализовать с ин- 
вертируемым выходом. При этом функция вентиля такая же, как описано выше, за 
исключением инверсии выхода (в столбце "Выход" табл. 2.2—2.4 ноль заменяется 
единицей, а единица — нулем). Схематическое обозначение вентилей И, ИЛИ или 
исключающего ИЛИ с инвертированным выходом имеет небольшой кружок, до- 
бавленный на стороне выхода, как и в случае с вентилем НЕ. Названия вентилей с 
инвертированными выходами И-НЕ, ИЛИ-НЕ и исключающее ИЛИ-НЕ. НЕ в каж- 
дом из этих названий означает НЕТ. Например, И-НЕ означает инверсию Й, что 
функционально эквивалентно вентилю И, за которым следует вентиль НЕ. 


Простые логические вентили можно комбинировать для получения более сложных 
функций. Мультиплексор — это схема, которая выбирает один из нескольких вхо- 
дов для передачи на свой выход в зависимости от состояния входа селектора. На 
рис. 2.9 показана схема мультиплексора с двумя входами. 


| 


1 
Рис. 2.9. Схема мультиплексора с двумя входами 


Схема имеет два однобитных входа данных: / и Л. Когда на входе селектора А вы- 
сокий уровень, на выход О передается значение 1. Когда на входе А низкий уро- 
вень, на выход передается значение /\. Одно из применений мультиплексора в ар- 
хитектуре процессора — выбор входных данных одного из нескольких источников 
при загрузке внутреннего регистра. 
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Таблица истинности мультиплексора с двумя входами приведена в табл. 2.5. В этой 
таблице значение Х означает "безразлично", т. е. состояние этого сигнала не влияет 
на определение состояния выхода (0). 


Таблица 2.5. Таблица истинности мультиплексора с двумя входами 


Логические вентили, описанные в этом разделе, и схемы, построенные на их осно- 
ве, представляют комбинационную логику, когда значение на выходе в любой 
момент времени зависит только от текущего состояния входов. На данный момент 
мы игнорируем задержку распространения и предполагаем, что выход схемы не- 
медленно реагирует на изменения входов. Другими словами, при этих допущениях 
выход не зависит от предыдущих значений входов. Комбинационные логические 
схемы не запоминают прежние значения входов или выходов. 


В следующем разделе мы рассмотрим некоторые схемы, которые могут сохранять 
сведения о предыдущих операциях. 


Защелки 


Комбинационная логика не позволяет напрямую сохранять данные, что необходи- 
мо для реализации цифровых функций, таких как регистры процессора. Логические 
вентили можно использовать для создания элементов хранения данных путем пере- 
дачи сигнала обратной связи с выхода одного вентиля на вход другого вентиля, 
предшествующего первому в цепи передачи сигнала. 


Рис. 2.10. Схема 5$К-защелки 


Защелка — это однобитное запоминающее устройство, построенное из логических 
вентилей. На рис. 2.10 показан простой тип защелки, называемый защелкой с 
установкой и сбросом (5е{-гезе! |а<В) или 5В-защелкой. Особенностью этой схе- 
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мы, обеспечивающей запоминание состояния, является обратная связь с выхода 
вентиля И на вход вентиля ИЛИ. 


В зависимости от состояния входов 5 и А эта схема может установить выход О (пе- 
ревести его на высокий уровень), сбросить выход О (перевести его на низкий уро- 
вень) или удерживать на выходе О его последнее значение. В состоянии удержания 
оба входа 5 и К имеют низкий уровень, а состояние выхода О сохраняется. Подача 
положительного импульса на вход 9 (переход от низкого уровня к высокому, а за- 
тем возврат на низкий уровень) вызывает переход выхода О на высокий уровень и 
удержание этого уровня. Подача положительного импульса на вход К вызывает пе- 
реход выхода 0) на низкий уровень и удержание этого уровня. Если на обоих вхо- 
дах, 5 и К, действует высокий уровень, вход А имеет приоритет над входом 5 и пе- 
реводит О на низкий уровень. 


Таблица истинности для К5-защелки приведена в табл. 2.6. Отред представляет по- 
следнее значение выхода (), выбранное в результате действий входов 5 и К. 


Таблица 2.6. Таблица истинности Ю5-защелки 


а Че И 
Го о [ею [бы 


О ПОС ОС ООО 
ВЕ ЗИ БЕРИ Е ОСН 


При работе с этой схемой защелки и вообще с устройствами энергозависимой па- 
мяти следует помнить о том, что начальное состояние выхода О при включении 
питания является неопределенным. Поведение схемы при запуске и конечное со- 
стояние выхода (зависят от характеристик и синхронизации работы отдельных 
вентилей по мере их срабатывания. После включения питания и перед началом ис- 
пользования этой схемы по ее назначению необходимо подать импульс на вход 5 
или К, чтобы перевести выход (0) в известное состояние. 


Управляемая Р-защелка, где О означает данные, имеет множество применений в 
цифровых схемах. Термин "управляемая" указывает на использование дополни- 
тельного входа, который разрешает или запрещает прохождение данных через схе- 
му. На рис. 2.11 показана реализация управляемой О-защелки. 


Состояние входа О передается на выход О, когда на входе Ё (разрешение) высокий 
уровень. Когда на входе Ё низкий уровень, выход О сохраняет свое предыдущее 
значение независимо от состояния входа О. Выход О всегда выдает значение, об- 
ратное выходу О (горизонтальная черта над О означает НЕ). 


Стоит уделить некоторое время прослеживанию логической последовательности 
этой схемы, чтобы понять ее работу. Левая половина рис. 2.11, состоящая из входа 
р, вентиля НЕ и двух левых вентилей И-НЕ, представляет собой комбинационную 
логическую схему, выход которой всегда является прямой функцией входа. 
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Рис. 2.11. Схема управляемой О-защелки 


Таблица 2.7. Таблица истинности управляемой О-защелки 


Сначала рассмотрим случай, когда на входе Ё действует низкий уровень. При низ- 
ком уровне на входе Ё один из входов каждого из двух левых вентилей И-НЕ имеет 
низкий уровень, поэтому выход обоих вентилей равен | (см. табл. 2.2 и таблицу 
истинности вентиля И, не забывая, что вентиль И-НЕ эквивалентен вентилю И, 
за которым следует вентиль НЕ). В этом состоянии значение входа О не имеет зна- 
чения, и один из выходов, О или О, должен иметь высокое значение, а другой — 
низкое, из-за перекрестного соединения выходов двух правых вентилей И-НЕ с их 
входами. Это состояние будет сохраняться до тех пор, пока на входе Е действует 
низкий уровень. 


Когда на входе Е высокий уровень, то, в зависимости от состояния входа 0), на вы- 
ходе одного из двух левых вентилей И-НЕ будет низкий уровень, а на выходе дру- 
гого — высокий. Тот из них, на выходе которого действует низкое значение, обес- 
печит высокий выходной сигнал на подсоединенном к нему правом вентиле И-НЕ. 
Этот выходной сигнал подается в виде обратной связи на вход другого правого 
вентиля И-НЕ и при высоком уровне на обоих входах на выходе будет низкий уро- 
вень. В результате входной сигнал 2) передается на выход 0), а его обратное значе- 
ние появляется на выходе О. 


Важно понимать, что значения на выходах О и О не могут быть одновременно вы- 
сокими или низкими, т. к. такая ситуация представляет собой конфликт между вы- 
ходами и входами двух правых вентилей И-НЕ. Если одно из этих условий возник- 
нет случайно, например при подаче питания, схема автоматически настроится на 
стабильную конфигурацию, при которой Ои О будут находиться в противополож- 
ных состояниях. Как и в случае с 5К-защелкой, результат этой автоматической кор- 
рекции непредсказуем, поэтому, прежде чем использовать управляемую Д-защелку 
в каких-либо операциях, необходимо перевести ее в известное исходное состояние. 
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Инициализация выполняется путем установки высокого уровня на входе Е, выбора 
с помощью входа О желаемого начального значения на выходе () и затем установки 
низкого уровня на входе Е. 


Описанная выше управляемая О-защелка является устройством, запускаемым по 
уровню сигнала, т. е. значение на выходе О меняется в зависимости от значения на 
входе 0, пока на входе Е поддерживается высокий уровень. В более сложных циф- 
ровых схемах важной задачей становится синхронизация нескольких последова- 
тельно соединенных элементов схемы, позволяющая избавиться от необходимости 
тщательно учитывать задержки распространения сигнала между отдельными уст- 
ройствами. Использование общего тактового сигнала в качестве входного сигнала 
для нескольких элементов обеспечивает такую синхронизацию. 


В конфигурации с общим тактовым генератором компоненты обновляют состояния 
своих выходов в момент прохождения фронта или спада импульса тактового сигна- 
ла (т. е. в момент перехода от низкого уровня к высокому или от высокого уровня к 
низкому), а не непрерывно отслеживают высокий или низкий уровень входного 
сигнала. 


Срабатывание по фронту или спаду импульсов тактового сигнала полезно, поскольку 
эти события определяют точные моменты, в которые входы устройства должны 
быть стабильными и достоверными. После прохождения фронта или спада тактово- 
го сигнала входы устройства могут произвольно меняться при подготовке к сле- 
дующему активному фронту или спаду тактового сигнала, не оказывая влияния на 
уровень сигнала на выходах схемы. Рассмотренная далее схема триггера реагирует 
на фронты тактовых импульсов, обеспечивая эту желательную характеристику для 
сложных цифровых схем. 


Триггеры 


Устройство, которое изменяет состояние выхода только тогда, когда тактовый сиг- 
нал совершает заданный переход (от низкого уровня к высокому или от высокого 
уровня к низкому), называется устройством, запускаемым по фронту сигнала. 
Триггеры похожи на защелки, с той лишь разницей, что сигнал на выходе триггера 
определяется воздействием фронта тактового сигнала, а не непрерывного входного 
сигнала в течение срока его действия. 


Р-триггер, срабатывающий по фронту, является популярным компонентом циф- 
ровых схем и применяется для решения самых разных задач. В нем обычно исполь- 
зуются входные сигналы установки и сброса, которые выполняют те же функции, 
что ив 5А-защелке. Этот триггер имеет вход О, который функционирует так же, как 
вход О управляемой Д-защелки. Вместо входа разрешения у Д-триггера имеется 
тактовый вход, который запускает передачу сигнала со входа 2 на выход О и, с ин- 
версией, на выход О по фронту тактового сигнала. Триггер не реагирует на измене- 
ние состояние входа О за пределами очень узкого временного окна, окружающего 
фронт тактового сигнала. Изменения состояния входов 5 и К имеют приоритет над 
любыми изменениями на входе 1) и входе тактового сигнала. 
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На рис. 2.12 представлено схематическое обозначение Д-триггера. Вход тактового 
сигнала обозначен маленьким треугольником в левой части символа. 


Рис. 2.12. Схематическое обозначение О)-триггера 


Рассмотрим табл. 2.8. Направленные вверх стрелки в столбце СЁК указывают на 
фронт тактового сигнала. Значения для выходов О и О в строках таблицы с направ- 
ленными вверх стрелками представляют состояние выходов после прохождения 
фронта тактового сигнала. 


Таблица 2.8. Таблица истинности О-триггера 


Триггеры можно соединить последовательно, чтобы обеспечить передачу битов 
данных от одного триггера к другому в последовательных тактовых циклах. Это 
достигается путем подсоединения выхода () первого триггера ко входу О второго 
триггера с аналогичным продолжением для любого количества ступеней. Эта 
структура, называемая регистром сдвига, имеет множество вариантов применения, 
включая последовательно-параллельное преобразование и параллельно-последова- 
тельное преобразование. 


Если выход О в конце регистра сдвига подсоединить к входу ДО на другом конце 
регистра, получится кольцевой счетчик. Кольцевые счетчики используются для 
таких задач, как построение конечных автоматов. Последние реализуют матема- 
тическую модель, которая всегда находится в одном из ряда четко определенных 
состояний. Переходы между состояниями происходят, когда значения на входах 
удовлетворяют требованиям для перехода в другое состояние. 


Кольцевой счетчик, представленный на рис. 2.13, имеет четыре позиции. Счетчик 
инициализируется путем подачи на вход А5Т положительного импульса, т. е. сна- 
чала высокого, а затем низкого уровня. Этот импульс устанавливает выход О пер- 
вого (крайнего левого) триггера в состояние 1, а выходы О) остальных триггеров — 
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в состояние 0. После этого каждый фронт сигнала на входе СЕК передает 1 бит в 
следующий по порядку триггер. Четвертый импульс СЁК передает | обратно в 
крайний левый триггер. В любой момент времени на выходе 0) одного триггера — 1, 
а выходы всех остальных триггеров имеют значение 0. 


Триггеры — это устройства, запускаемые по фронту импульса, и все они управля- 
ются общим тактовым сигналом, что делает эту схему синхронной. 


Рис. 2.13. Схема четырехпозиционного кольцевого счетчика 


Эта схема содержит четыре состояния кольцевого счетчика. Если добавить еще 
шесть триггеров, то количество состояний достигнет 10. Как мы уже говорили в 
главе 1, в машине ЕМТАС для сохранения состояния десятичных цифр использова- 
лись 10-позиционные кольцевые счетчики на основе электронных ламп. Кольцевой 
счетчик, хранящий 10 состояний, основанный на схеме, приведенной на рис. 2.13, 
может выполнять ту же функцию. 


В следующем разделе мы создадим из триггеров регистры для хранения данных. 


Регистры 


Регистры процессора временно хранят значения данных и служат в качестве места 
хранения входных и выходных данных для операций различных инструкций, вклю- 
чая перемещение данных в память и из памяти, арифметические операции и мани- 
пуляции с битами. В большинстве процессоров общего назначения предусмотрены 
инструкции для сдвига двоичных значений, хранящихся в регистрах, влево или 
вправо, а также для выполнения операций вращения, при которых биты данных, 
смещенные с одного конца регистра, вставляются с противоположного конца. Опе- 
рация вращения аналогична кольцевому счетчику, за исключением того, что биты в 
цикле могут содержать произвольные значения, в то время как кольцевой счетчик 
обычно передает один бит, равный единице, через последовательность позиций. 
Схемы, выполняющие эти функции, строятся из низкоуровневых вентилей и триг- 
геров, представленных ранее в этой главе. 


Операции записи и чтения данных регистров внутри процессора обычно выполня- 
ются параллельно. Это означает, что все биты записываются или считываются по 
отдельным сигнальным линиям одновременно под управлением фронта общего 
тактового сигнала. В примерах, представленных в этом разделе, для простоты ис- 
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пользуются 4-разрядные регистры, но эти схемы легко расширить до 8, 16, 32 или 
64 разрядов. 


На рис. 2.14 показан простой 4-разрядный регистр с параллельными вводом и вы- 
водом. Это синхронная схема, в которой биты данных, поступающие на входы Ду- 
Р», загружаются в триггеры по фронту тактового сигнала СЕК. Биты данных сразу 
же появляются на выходах (0%-—Оз и сохраняют свое состояние до тех пор, пока но- 
вые значения данных не будут загружены по фронту следующего импульса такто- 
вого сигнала. 


[р Ц; 0, а, 0! @: 0% (@ 


СК 


РИС. 2.14. Схема 4-разрядного регистра 


Для реализации полезных функций, помимо простого хранения данных в регистре, 
необходима возможность загружать в регистр данные из нескольких источников, 
выполнять операции с содержимым регистра и записывать получаемые значения в 
одно из мест назначения, которых может быть несколько. 


В процессорах общего назначения данные обычно загружаются в регистр из ячейки 
памяти, через входной порт или путем переноса из другого регистра. Операции, 
выполняемые над содержимым регистра, могут включать в себя увеличение на 1, 
уменьшение на |, арифметические операции, сдвиг, вращение и битовые манипу- 
ляции, такие как операции И, ИЛИ и исключающее ИЛИ. Обратите внимание, что 
увеличение или уменьшение целого числа на | эквивалентно операции сложения 
или вычитания одного операнда со вторым подразумеваемым операндом, равным 1. 
После внесения в регистр результата вычисления его содержимое может быть запи- 
сано в ячеику памяти, в выходной порт или в другой регистр. 


На рис. 2.9 показана схема мультиплексора с двумя входами. Эту схему легко рас- 
ширить, чтобы она поддерживала большее количество входов, любой из которых 
может быть выбран управляющими сигналами. Однобитовый мультиплексор мож- 
но реплицировать для поддержки одновременной работы со всеми битами слова 
процессора. Такая схема используется для выбора среди множества источников при 
загрузке данных в регистр. При реализации в процессоре логика, запускаемая оп- 
кодами инструкций, устанавливает управляющие входы мультиплексора для мар- 
шрутизации данных от выбранного источника в указанный регистр назначения. 
В главе 3 использование мультиплексоров будет расширено для маршрутизации 
данных к регистрам и другим блокам внутри процессора. 


В следующем разделе будут представлены схемы для сложения двоичных чисел. 
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Сумматоры 


Процессоры общего назначения обычно поддерживают операцию сложения для 
выполнения вычислений над значениями данных и отдельно для управления указа- 
телем инструкций. После выполнения каждой инструкции указатель инструкций 
увеличивается на | для указания на позицию следующей инструкции. 


Если процессор поддерживает инструкции, состоящие из нескольких слов, новое 
значение указателя инструкций должно равняться своему текущему значению плюс 
количество слов в только что выполненной инструкции. 


Схема простого сумматора складывает два бита данных, учитывает перенос из пре- 
дыдущего разряда и выдает на выходе однобитную сумму и признак переноса. Эта 
схема, показанная на рис. 2.15, называется полным сумматором, поскольку она 
учитывает входящий перенос. Полусумматор складывает только два бита данных 
без учета переноса из предыдущего разряда. 


А 
В 
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Рис. 2.15. Схема полного сумматора 


Полный сумматор использует логические вентили для получения результата на вы- 
ходе следующим образом. Бит суммы 5 равен 1 только в том случае, если общее 
количество битов со значением | в наборе А, В, С», является нечетным числом. 
В ином случае бит 5 равен 0. Эту логическую операцию выполняют два вентиля 
типа "исключающее ИЛИ". Выход Сьыь»х равен 1, если оба входа, А и В, равны 1, или 
если только один из входов, /А или В, равен 1, и С„„ также равен 1. Иначе Сььх равен 0. 


Для использования в схемах более высокого уровня схему, показанную на 
рис. 2.15, можно свести к схематическому блоку, который имеет три входа и два 
выхода. На рис. 2.16 показан 4-разрядный сумматор с четырьмя блоками, представ- 
ляющими копии схемы полного сумматора с рис. 2.15. Входные данные — это два 
слова, которые нужно сложить, 4о—Аз и Ви—Вз, и признак переноса из предыдущего 
разряда С»х. Результатом будут сумма 5—5; и перенос в следующий разряд Сьых. 


Важно отметить, что эта схема является комбинационной. Это означает, что после 
установки значений на входах выходные значения формируются напрямую. Это 
также относится и к распространению переноса от бита к биту, независимо от того, 
на какое количество битов влияют переносы. Поскольку перенос осуществляется 
по битам, эта конфигурация называется сумматором со сквозным переносом. 
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53 Аз Вз 52 А› В? 51 А, В! 5° Ао Во 


Полный Полный Полный Полный 
сумматор сумматор сумматор 


Рис. 2.16. Схема 4-разрядного сумматора 


Требуется некоторое время, чтобы переносы распространились по всем позициям 
битов и на выходах стабилизировались конечные значения. 


Поскольку мы сейчас обсуждаем схему, в которой путь сигнала проходит через 
значительное количество устройств, уместно обсудить факторы, влияющие на вре- 
мя, необходимое для прохождения сигналов через множество компонентов. 


Задержка распространения 


При изменении входного сигнала логического устройства его выходной сигнал ме- 
няется не мгновенно. Между изменением состояния на входе и появлением резуль- 
тата на выходе имеется временная задержка. Она называется задержкой распро- 
странения. Задержка распространения сигнала через схему устанавливает верхний 
предел тактовой частоты, на которой может работать схема. В микропроцессоре 
тактовая частота определяет скорость, с которой устройство может выполнять ин- 
струкции. 


Последовательное соединение нескольких комбинационных схем приводит к об- 
щей задержке распространения, равной сумме задержек отдельных устройств. Вен- 
тиль может иметь разные значения задержки распространения сигнала для перехо- 
да от низкого уровня к высокому и для перехода от высокого уровня к низкому, 
поэтому при оценке наихудшей задержки в контуре следует использовать большее 
из этих двух значений. 


Как показано на рис. 2.15, самый длинный путь (с точки зрения количества после- 
довательно включенных вентилей) от входа к выходу для полного сумматора — от 
входов 4 и В квыходу Сьых: всего три последовательных вентиля. Если все входные 
сигналы 4-разрядного сумматора на рис. 2.16 устанавливаются одновременно, за- 
держка в трех вентилях, связанная с входами А и В, будет происходить одновре- 
менно во всех четырех сумматорах. Однако выход Су полного сумматора 0 будет 
гарантированно стабильным только после задержки в трех вентилях этого сумма- 
тора. После того как Су стабилизируется, возникает дополнительная задержка про- 
хождения сигнала через два вентиля полного сумматора | (обратите внимание на 
рис. 2.15, где видно, что сигнал с С», проходит только через два последовательных 
уровня вентилей). 


Таким образом, общая задержка распространения для схемы на рис. 2.16 составляет 
три задержки в вентилях на полном сумматоре 0, за которыми следуют по две за- 
держки в вентилях на каждом из остальных трех полных сумматоров — в общей 
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сложности девять задержек в вентилях. Такая задержка может показаться не слиш- 
ком значительной, но рассмотрим 32-разрядный сумматор: общая задержка распро- 
странения для этого сумматора составляет три задержки в вентилях для полного 
сумматора 0 плюс две задержки каждого из остальных сумматоров — в общей 
сложности 65 задержек в вентилях. 


Путь с максимальной задержкой распространения сигнала через комбинационную 
схему называется критическим путем. Задержка критического пути устанавливает 
верхний предел тактовой частоты, которая может использоваться для управления 
схемой. 


Семейство логических вентилей на усовершенствованных транзисторно-тран- 
зисторных логических схемах с барьерами Шотки (адуапсед ЭсКойКу {гапз1$юг — 
{гап$1$ юг 1ю21с, (АЗ) ТТГ.), обозначаемых сокращением УТТЛИШ, является одним из 
самых быстрых вентилей в отдельном корпусе, доступных на сегодняшний день. 


При типичной нагрузке УТТЛШ-вентиль И-НЕ имеет задержку распространения 
2 наносекунды (нс). Для сравнения: за 2 нс свет в вакууме проходит чуть менее 60 см. 


В 32-разрядном сумматоре со сквозным переносом 65 задержек распространения 
сигнала через УТТЛШ-вентили складываются в суммарную задержку между уста- 
новлением входных сигналов и получением стабильных конечных выходных сиг- 
налов, равную 130 нс. Для того чтобы сделать приблизительную оценку, предпо- 
ложим, что это наибольшая возможная задержка распространения сигнала через 
всю интегральную схему процессора. Мы также проигнорируем любое дополни- 
тельное время, требуемое для сохранения стабильности входов до и после активно- 
го фронта тактового сигнала. Таким образом, этот сумматор не может выполнять 
последовательные операции с входными данными чаще, чем раз в 130 нс. 


При выполнении 32-разрядного сложения с помощью сумматора со сквозным пе- 
реносом процессор использует фронт тактового сигнала для переноса содержимого 
двух регистров (каждый из которых состоит из набора Л-триггеров) и флага С про- 
цессора на входы сумматора. Следующий фронт тактового сигнала вызывает за- 
грузку результатов сложения в регистр назначения. Флаг С процессора принимает 
значение Сьы» от сумматора. 


Тактовый сигнал с периодом 130 нс имеет частоту 1/130 нс, что составляет 7,6 МГц. 
Эта частота, конечно, не выглядит слишком высокой, особенно если учесть, что 
сегодня доступно много недорогих процессоров с тактовой частотой более 4 ГГц. 
Одной из причин этого расхождения является присущее интегральным схемам, со- 
держащим большое количество плотно скомпонованных транзисторов, преимуще- 
ство в быстродействии, а вторая обусловлена изобретательностью разработчиков, о 
чем упоминал Гордон Мур (см. главу Г). Для эффективного выполнения функций 
сумматора было разработано множество оптимизированных решений, позволяю- 
щих существенно уменьшить наибольшую задержку распространения. В главе 8 мы 
обсудим некоторые методы, которые используют архитекторы процессоров, чтобы 
добиться более высоких скоростей в своих конструкциях. 
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В дополнение к задержкам вентилей существует также некоторая задержка, возни- 
кающая в результате прохождения сигнала по проводам и токоведущим дорожкам 
интегральной схемы. Скорость прохождения сигнала по проводам или через другой 
тип проводящего материала меняется в зависимости от свойств материала провод- 
ника и изоляционного материала, окружающего проводник. В зависимости от этих 
и других факторов скорость прохождения сигнала в цифровых схемах обычно со- 
ставляет 50-90% скорости света в вакууме. 


В следующем разделе обсуждается генерирование и использование тактовых сиг- 
налов в цифровых схемах. 


Синхронизация 


Тактовый сигнал задает "сердечный ритм" процессора. Этот сигнал обычно имеет 
прямоугольную форму и фиксированную частоту. Прямоугольный сигнал — это 
цифровой сигнал, попеременно принимающий высокое и низкое значения, при 
этом в каждом цикле пребывание сигнала на высоком и низком уровнях занимает 
равные промежутки времени. На рис. 2.17 показан пример изменения прямоуголь- 
ного сигнала во времени. 


Рис. 2.17. Прямоугольный сигнал 


Тактовый сигнал в компьютерной системе обычно генерирует кварцевый генератор 
с базовой частотой в несколько мегагерц (МГц). 1 МГц — это 1 млн циклов в се- 
кунду. Принцип действия кварцевого генератора основан на использовании резо- 
нансных колебаний физического кристалла (обычно изготавливаемого из кварца) 
для формирования циклического электрического сигнала. Механическая вибрация 
кристалла преобразуется в электрический сигнал с помощью пьезоэлектрического 
эффекта. Пьезоэлектрический эффект — это накопление электрического заряда в 
определенных кристаллах при механическом воздействии. Кристаллы кварца резо- 
нируют на точных частотах, поэтому их используют в качестве элементов синхро- 
низации в компьютерах, наручных часах и других цифровых устройствах. 


Кварцевые генераторы являются более точными источниками тактовых сигналов 
синхронизации, чем альтернативные решения, которые находят применение в не- 
дорогих устройствах, однако кристаллам свойственны ошибки в частоте, которые 
накапливаются в течение нескольких дней и недель, постепенно доводя отклонения 
от правильного времени до секунд, а затем — до минут. Для того чтобы избежать 
этой проблемы, большинство компьютеров, подключенных к Интернету, периоди- 
чески обращаются к серверу времени, чтобы привести свои внутренние часы к те- 
кущему времени, публикуемому точными атомными эталонными часами. 


Схемы умножителя частоты на основе контура фазовой автоподстройки частоты 
(ФАПЧ) используются для генерирования высокочастотных тактовых сигналов, 
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необходимых процессорам, работающим на частотах в несколько гигагерц. Умно- 
житель частоты с ФАПЧ генерирует выходной сигнал прямоугольной формы с 
определенной частотой, которая выражается целым числом, кратным входной час- 
тоте, подаваемой на него от кварцевого генератора. Отношение частоты тактового 
сигнала на выходе умножителя с ФАПЧ к частоте его входного сигнала называется 
множителем тактовой частоты. 


Умножитель частоты с ФАПЧ работает путем непрерывной регулировки частоты 
своего внутреннего генератора для поддержания требуемого множителя тактовой 
частоты относительно входной частоты ФАПЧ. Современные процессоры обычно 
имеют вход тактового сигнала кварцевого генератора и содержат несколько умно- 
жителей частоты с ФАПЧ, генерирующих разные частоты. Эти выходные частоты 
ФАПЧ затем управляют основными операциями процессора с максимально воз- 
можной скоростью, одновременно взаимодействуя с компонентами, требующими 6бо- 
лее низких тактовых частот, такими как системная память и периферийные устройства. 


Последовательностная логика 


Цифровые схемы, генерирующие выходные сигналы на основе комбинации теку- 
щих и прежних состояний входов, называются последовательностными логиче- 
скими схемами. Этим она отличается от комбинационной ЛОГИКИ, ГДе СОСТОЯНИЯ 
выходов зависят только от текущего состояния входов. 


Если последовательностная логическая схема, состоящая из нескольких компонен- 
тов, управляет этими компонентами с помощью общего тактового сигнала, эта схе- 
ма реализует синхронную логику. 


Действия, связанные с выполнением инструкций процессора, представляют собой 
серию дискретных операций, которые потребляют входные данные в виде опкодов 
инструкций и значений данных, получаемых из различных источников. Эта дея- 
тельность осуществляется при координации на основе главного тактового сигнала. 
Процессор сохраняет информацию о внутреннем состоянии от одного такта к сле- 
дующему и от одной инструкции к другой. 


Современные сложные цифровые устройства, включая процессоры, почти всегда 
реализуются как синхронные последовательностные логические устройства. Внут- 
ренние компоненты низкого уровня, такие как вентили, мультиплексоры, регистры 
и сумматоры, рассмотренные ранее, обычно представляют собой комбинационные 
логические схемы. Эти низкоуровневые компоненты, в свою очередь, получают 
входные данные под управлением синхронной логики. По прошествии достаточно- 
го времени для распространения сигнала по комбинационным компонентам общий 
тактовый сигнал передает выходные данные этих компонентов другим частям ар- 
хитектуры под управлением инструкций процессора и логических схем, которые 
выполняют эти инструкции. 


В главе 3 будут представлены компоненты процессора более высокого уровня, реа- 
лизующие более сложные функциональные возможности, включая декодирование 
инструкций, их выполнение и арифметические операции. 
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В следующем разделе представлена идея проектирования цифрового оборудования 
с использованием языков, которые очень похожи на традиционные языки програм- 
мирования компьютеров. 


Языки описания аппаратных средств 


Простые цифровые схемы легко представить с помощью логических схем, подоб- 
ных тем, которые были приведены ранее в этой главе. Однако при проектировании 
более сложных цифровых устройств работа с логическими схемами быстро стано- 
вится громоздким и неудобным решением. В качестве альтернативы логическим 
схемам за прошедшие годы было разработано несколько языков описания аппа- 
ратных средств. Этой разработке способствовал закон Мура, который побуждает 
проектировщиков цифровых систем постоянно находить новые способы наиболее 
быстрого и эффективного использования постоянно растущего числа транзисторов, 
доступных в интегральных схемах. 


Языки описания аппаратных средств не являются исключительной прерогативой 
разработчиков цифровых схем в компаниях-производителях полупроводников; да- 
же любители могут приобрести и использовать эти мощные инструменты по дос- 
тупной цене. Некоторые из них предоставляются бесплатно. 


Вентильная матрица — это логическое устройство, содержащее множество логи- 
ческих элементов, таких как вентили И-НЕ и Д-триггеры, которые можно соеди- 
нить друг с другом для формирования произвольных схем. 


С помощью вентильных матриц, отнесенных к категории программируемых 
пользователем вентильных матриц (ППВМ), конечные пользователи могут реа- 
лизовывать собственные проекты, используя только компьютер, небольшую макет- 
ную плату и соответствующий пакет программного обеспечения. 


Разработчик может спроектировать сложную цифровую схему с помощью языка 
описания аппаратных средств и запрограммировать ее непосредственно в микро- 
схему, в результате чего получится полнофункциональное и высокопроизводитель- 
ное пользовательское цифровое устройство. Современные недорогие ППВМ со- 
держат достаточное количество вентилей для реализации сложных современных 
процессорных архитектур. В качестве примера можно привести запрограммиро- 
ванную на ПИВМ архитектуру процессора К1$С-У (подробно обсуждается в гла- 
ве 11), доступную в виде кода на языке описания аппаратных средств с открытым 
исходным кодом. 


УНОЕ 


УНПОГ. — это один из наиболее распространенных на сегодняшний день языков 
описания аппаратных средств. Разработка УНОГ. началась в 1983 г. по заказу Ми- 
нистерства обороны США. Синтаксис и часть семантики УНП, основаны на языке 
программирования Ада. Кстати, язык Ада получил свое название в честь Ады 
Лавлейс, программиста аналитической машины Чарльза Бэббиджа, обсуждавшейся 
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в главе 1. Другим популярным языком описания аппаратных средств с возможно- 
стями, аналогичными УНОПГ, является Уеор. В этой книге будет использоваться 
исключительно УНПОГ, но приведенные здесь примеры также можно легко реали- 
зовать на языке УегПор. 


УНОГ, — это многоуровневая аббревиатура, в которой "У" расшифровывается как 
УНЗС (уегу мрВ-5рее4 имертае4 стсий), что означает сверхбыстрая интеграль- 
ная схема (СБИС), а УНОГ, (УН$ГС Ваг4угаге дезсирИоп |априаре) означает язык 
описания аппаратных средств СБИС. Приведенный ниже код представляет со- 
бой реализацию на УНОГ, схемы полного сумматора, показанной на рис. 2.15. 


-- Загрузка стандартных библиотек 


116гагу ТЕЕЕ; 
изе ТЕЕЕ.$ТО 1О0СТС_1164.АШЕ; 


-- Определение входов и Выходов полного сумматора 


еп1%у РОШ. АБОЕВ 1$ 


роге ( 
А г шт $44 1061с; 
В : м $14 1081с; 
СТМ : т $44 10р21с; 
5 : 0 54а 1ор1с; 


СОТ : оц — $44 1051с 
); 
еп епЕ1Фу РУЁГЁ_АООЕВ; 
-- Определение поведения полного сумматора 


агсп1есфиге ВЕНАУТОВАЕ о+ РОГ._АООЕВ 1$ 


Бер1п 


м 
^ 
Ш 


(А ХОВ В) ХОВ С тм; 
СОТ <= (А АЮ В) ОВ ((А ХОВ В) АЮ С лм); 


еп агсА1есфиге ВЕНАУТОКАЕ ; 


Здесь раздел, начинающийся с еп1%у РИШ:_АБОЕВ, определяет входы и выходы пол- 
ного сумматора. Раздел агси1{есеиге в конце кода описывает, как работает логика 
схемы для получения выходных сигналов 5 и С_ОПТ на основе входных сигналов 
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А, Ви СЛУ. Термин $+4_1о61с указывает на однобитовый двоичный тип данных. 
Символы <= отражают назначение сигнала, подобное проводному соединению, пе- 
редающему на выход, указанный в левой части, значение, вычисленное в правой 
части. 


Следующий код ссылается на УНРОГ-описание полного сумматора гУИ. АБОЕВ, как 
на компонент реализации 4-разрядного сумматора, представленного на рис. 2.16. 


-- Загрузка стандартных библиотек 


]116гагу ТЕЕЕ; 
изе ТЕЕЕ.$5ТО_ЕОСТС_1164.АН.; 


-- Определение входов и выходов 4-разрядного сумматора 


епЕ1Фу АБОЕВА 1$ 


роге ( 
АД : п 549 _1061с_месфог(3 домпфо @); 
В4 : $44 1051с_уес®ог(3 домпфо 0); 
$ИМА : ОУ — $49 1ор1с уес®Фог(3 аомпто 0); 


С МЛ4 : о — $4а 1ор1с 
); 
епа епЕ1Фу АБОЕВА; 
-- Определение поведения 4-разрядного сумматора 


агсР1Фесфиге ВЕНАУТОВАЕ о+ АПОЕВА 15$ 


-- Ссылка на предьюущее определение полного сумматора 
сотропепе РУ. АГОЕВ 1$ 


роге ( 
А : м 54 1051с; 
В : м 54 1051с; 
СМ : м 544 _10р1с; 
5 : 0 $44 1061с; 


СОТ : ош $44 1921с 
); 
еп сотропепе; 


-- Определение внутренних сигналов 4-разрядного сумматора 
$1епа1 с@, с1, с2 : $4 1061с; 
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бер1пт 


-- Назначение входу переноса первого сумматора значения @ 
РУЕ-_АБОЕКО : РОГ АБОЕК 


роге мар ( 
А => А4(0), 
В => В4(0), 
См => '0', 
5 => 50М4 (0), 
СОТ => с@ 

); 


РО_АБОЕК1 : РУЁЬ_АОБЕВ 


рог тар ( 
А => А4(1), 
В => В4(1), 
СТМ => с68, 
5 => $0М4(1), 
СОТ => с1 
); 
РИЦ. АБОЕВ2 : РИМ. _АБОЕВ 
роге тар ( 
А => А4(2), 
В => В4(2), 
СТМ => (1, 
5 => $1М4 (2), 
СОТ => с2 
); 
РОЕ-_АБОЕКЗ : РУЕЕ_АбОЕК 
роге тар ( 
А => АД(3), 
В => В4(3), 
СТМ => с2, 
5 => 5ИМА(З), 
СОТ => С ОЛ4 
); 


еп агс/1ес®иге ВЕНАУТОКАГ; 
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Здесь фрагмент кода, начинающийся с еп44у АГОЕВА, определяет входы и выходы 
4-разрядного сумматора. Фраза $+4 1оЕ1с_месфог(3 доипфо @) представляет тип дан- 
ных в виде 4-разрядного вектора с битом № 3 в наиболее значимой позиции и би- 
том № 0 в наименее значимой позиции. 


Компонент ЕУШ._АБОЕВ определен в отдельном файле, ссылка на который приведена 
в начале раздела сотропепё РУЁ:_АБОЕВ 1$. Выражение $1епа1 с@, с1, с2 : $4 1ов1с; 
определяет внутренние значения переноса между полными сумматорами. Четыре 
раздела рой тар определяют соединения между сигналами 4-разрядного сумматора 
и входами/выходами каждого из одноразрядных полных сумматоров. Для ссылки 
на бит в битовом векторе номер бита следует за именем параметра в круглых 
скобках. Например, 44(0) ссылается на наименее значимый из четырех битов 
в 44. 


Обратите внимание на использование иерархии в этой структуре. Сначала в от- 
дельном, автономном блоке кода был определен простой компонент — однораз- 
рядный полный сумматор. Затем этот блок был использован для построения более 
сложной схемы — 4-разрядного сумматора. Такой иерархический подход можно 
распространить на многие уровни, чтобы определить сложное цифровое устройст- 
во, построенное из менее сложных компонентов, каждый из которых, в свою оче- 
редь, состоит из еще более простых частей. Этот общий подход обычно использу- 
ется при разработке современных процессоров, содержащих миллиарды транзис- 
торов, и позволяет контролировать уровень сложности, чтобы архитектура была 
понятна людям на каждом уровне иерархии. 


Код, представленный в этом разделе, содержит все схемные определения, кото- 
рые требуются программному инструменту логического синтеза для реализации 
4-разрядного сумматора в качестве компонента ПИВМ. Конечно, необходима до- 
полнительная схема для передачи в схему сумматора осмысленных входных дан- 
ных, а также для обработки результатов операции сложения с учетом задержки 
прохождения сигнала. 


В этом разделе представлено весьма краткое введение в УНОГ.. Цель состоит в том, 
чтобы дать вам понять, что языки описания аппаратных средств, такие как УНОГ, 
являются современным достижением в области проектирования сложных цифро- 
вых схем. Кроме того, вам следует знать, что есть некоторые совсем недорогие ин- 
струменты и устройства для разработки ППВМ. В упражнениях, приведенных в 
конце этой главы, вы познакомитесь с некоторыми полезными бесплатными инст- 
рументами разработки ППВМ. Рекомендую вам поискать информацию в Интерне- 
те, чтобы узнать больше о УНПГ. и других языках описания аппаратных средств, 
а также попробовать свои силы в разработке некоторых простых (и не очень про- 
стых) схем. 
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Резюме 


Эта глава началась с введения в свойства электрических цепей, которое показало, 
как компоненты, такие как источники напряжения, резисторы и провода, изобра- 
жаются на схемах. Был представлен транзистор с акцентом на его использовании в 
качестве переключающего элемента в цифровых схемах. Из транзисторов и рези- 
сторов были составлены схемы вентилей НЕ и И. Были определены логические 
элементы других типов, и для каждого устройства представлены таблицы истинности. 
Логические элементы использовались для построения более сложных цифровых 
схем, включая защелки, триггеры, регистры и сумматоры. Была введена концепция 
последовательностной логики и обсуждена ее применимость для проектирования 
процессоров. Наконец, были представлены языки описания аппаратных средств и 
пример описания 4-разрядного сумматора на языке УНОГ. 


Теперь вы знакомы с основными концепциями цифровых схем и инструментами 
проектирования, используемыми при разработке современных процессоров. В сле- 
дующей главе мы более подробно рассмотрим эти структурные элементы, чтобы 
изучить функциональные составляющие современных процессоров, а также обсу- 
дим, как координируется работа этих компонентов для реализации основного рабо- 
чего цикла процессора, состоящего из загрузки, декодирования и выполнения инст- 


рукций. 


Упражнения 


1. Измените схему, представленную на рис. 2.5, чтобы превратить вентиль И в 
вентиль И-НЕ. Подсказка: добавлять или удалять компоненты не требуется. 


2. Создайте реализацию схемы вентиля ИЛИ, изменив схему, представленную на 
рис. 2.5. По мере необходимости можно добавлять провода, транзисторы и ре- 
зисторы. 


3. Найдите в Интернете бесплатные программные пакеты для разработки на языке 
УНОГ, включающие имитатор. Установите один из этих пакетов, настройте его 
и попробуйте создать любые простые демонстрационные проекты, включенные 
в состав пакета, чтобы убедиться, что он работает должным образом. 


4. Используя набор инструментов УНОГ, создайте 4-разрядный сумматор с по- 
мощью листингов, представленных в этой главе. 


5. Добавьте в свой 4-разрядный сумматор код тестового драйвера (примеры мож- 
но найти в Интернете по фразе "ИНОЕ (езФепсй"), затем запустите его с огра- 
ниченным набором входных данных и проверьте правильность выходных дан- 
НЫХ. 


6. Раскройте код тестового драйвера и убедитесь, что 4-разрядный сумматор вы- 
дает правильные результаты для всех возможных комбинаций входных данных. 
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С этой главы начинается развитие нашего всестороннего понимания архитектуры 
современных процессоров. Опираясь на базовые цифровые схемы, представленные 
в главе 2, мы обсудим функциональные блоки простого процессора для универ- 
сального компьютера. В этой главе вводятся понятия, связанные с набором инст- 
рукций и набором регистров, за которыми следует обсуждение шагов, связанных с 
загрузкой, декодированием, выполнением и определением порядка следования ин- 
струкций. Режимы адресации и категории инструкций обсуждаются в контексте 
архитектуры процессора 6502. Мы решили сосредоточиться на этом, заслужившем 
всеобщее признание процессоре из-за его структурной чистоты и простоты, что по- 
зволит нам рассмотреть основные концепции, не отвлекаясь на второстепенные ас- 
пекты. Требования к обработке прерываний процессора вводятся на примере обра- 
ботки прерываний в процессоре 6502. Представлены стандартные подходы, 
используемые современными процессорами для операций ввода-вывода (три! 
ошруь, ГО), в том числе прямой доступ к памяти (Чгесё тетогу ассез$, ОМА). 


Прочитав эту главу, вы ознакомитесь с основными компонентами процессора и 
структурой наборов инструкций. Вы изучите категории инструкций процессора, 
узнаете, почему необходима обработка прерываний, и получите представление об 
операциях ввода-вывода. 


В этой главе будут рассмотрены следующие темы: 
е простой процессор; 
» набор инструкций процессора; 
® режимы адресации; 
» категории инструкций; 
» обработка прерываний; 


® операции ввода-вывода. 
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Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 
В рз://2ИВиБ.соп/Раск Ри $ т2/Модегпт-Сотрщег-АгсиКесиге-ап0- 
ОтраптаНопт-Зесопа-ЕЧюп. 


Простой процессор 


Архитектура процессора 6502 и несколько его инструкций были представлены в 
главе 1. В данном разделе мы будем опираться на этот фундамент, чтобы предста- 
вить некоторые функциональные компоненты, широко используемые в процессор- 
ных архитектурах, — от самых крошечных встроенных контроллеров до самых 
мощных серверных процессоров. 


Интегральная схема, лежащая в основе компьютерной системы, имеет несколько 
разных названий: центральный процессор (ЦП), микропроцессор или, попросту, 
процессор. Микропроцессор — это единая интегральная схема, реализующая все 
функции процессора. В этой книге все категории центральных процессоров и мик- 
ропроцессоров будут называться процессорами. 


Процессор, подобный 6502, содержит три логически различных функциональных 
блока. 


»е Устройство управления осуществляет общее управление работой процессо- 
ра. Процесс управления включает в себя извлечение следующей инструкции 
из памяти, декодирование инструкции для определения операции, которую 
требуется выполнить, и распределение действий по выполнению инструкции 
между соответствующими элементами процессора. 


е Арифметико-логическое устройство (АЛУ) — это комбинационная схема, 
которая выполняет арифметические операции и операции с битами. 


»е Набор регистров предоставляет исходные и конечные местоположения для 
хранения входных и выходных данных инструкций. Регистры также исполь- 
зуются в качестве мест для временного хранения данных. 


Регистры 


о Память 
Устройство 


управления 


и устройства 
ввода-вывода 


Рис. 3.1. Взаимодействие между функциональными блоками процессора 
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На рис. 3.1 показаны потоки управления и данных между устройством управления, 
регистрами, АЛУ, системной памятью и устройствами ввода-вывода. 


Устройство управления управляет общими операциями процессора для выполнения 
каждой инструкции. Регистры, АЛУ, память и устройства ввода-вывода реагируют 
на команды, инициируемые устройством управления. 


Устройство управления 


Устройство управления современного процессора представляет собой синхронную 
последовательностную цифровую схему. Оно интерпретирует инструкции процес- 
сора и управляет выполнением этих инструкций, взаимодействуя с другими функ- 
циональными блоками внутри процессора и с внешними компонентами, включая 
память и устройства ввода-вывода. Устройство управления является ключевой ча- 
стью архитектуры фон Неймана, реализованной в процессоре 6502. 


В этой главе термин "память" относится к оперативному запоминающему уст- 
ройству (ОЗУ, оперативная память), являющемуся внешним по отношению к 
исполнительным блокам процессора. Кеш-память, которая часто располагается на 
интегральной схеме микропроцессора, будет рассмотрена в следующих главах. 


Некоторые примеры устройств ввода-вывода: компьютерная клавиатура, мышь, 
дисковый накопитель и монитор. Другие распространенные устройства ввода- 
вывода: сетевые интерфейсы, интерфейсы беспроводной связи \/1-ЕЁ и Вшеюо*®, 
аудиовыход на динамики и микрофонный вход. 


После включения компьютерной системы процессор выполняет процедуру сброса 
для инициализации своих внутренних компонентов. Затем процессор загружает в 
программный счетчик (ПС) адрес ячейки памяти первой инструкции, которая 
должна быть выполнена. Разработчики программного обеспечения, создающие 
системные программные компоненты самого низкого уровня, должны настроить 
свои средства разработки для создания образа кода в памяти, выполнение которого 
начинается по адресу, требуемому архитектурой процессора. 


ПС является центральным компонентом устройства управления. Он всегда содер- 
жит адрес инструкции, которая должна быть выполнена следующей. В начале каж- 
дого цикла выполнения инструкции устройство управления считывает слово дан- 
ных из ячейки памяти по адресу, указанному ПС, и помещает его во внутренний 
регистр для декодирования и выполнения. Первое слово инструкции содержит код 
операции (опкод). На основе битового шаблона опкода устройство управления 
может считывать дополнительные ячейки памяти, следующие за опкодом, для из- 
влечения данных, требуемых инструкцией, таких как адрес ячейки памяти или опе- 
ранд данных. 


Когда устройство управления начинает выполнять инструкции, оно работает в по- 
вторяющемся цикле, показанном на рис. 3.2. 


После сброса ПС содержит адрес ячейки памяти с первой инструкцией. Устройство 
управления извлекает первую инструкцию из памяти и декодирует ее. Во время де- 
кодирования устройство управления определяет действия, требуемые инструкцией. 
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Сброс: 
инициализация 
ПС 


Извлечение 
следующей 
инструкции 


Декодирование 
инструкции 


Изменение 
содержимого 
ПС 


Увеличение 
ПС на 1 


Инструкция 
ветвления? 


Выполнение 
инструкции 


Рис. 3.2. Цикл выполнения инструкции 


Также в ходе процесса декодирования устройство управления определяет катего- 
рию инструкции. На рис. 3.2 представлены две основные категории инструкций — 
инструкции ветвления и все прочие инструкции. Инструкции ветвления реализуют- 
ся непосредственно устройством управления. Они вызывают замену содержимого 
ПС адресом ячейки памяти для выполнения ветви. Примеры инструкций, выпол- 
няющих ветвление: инструкции условного ветвления (когда осуществляется выбор 
ветви), вызовы подпрограмм, возвраты из подпрограмм и инструкции безусловного 
ветвления (также называемые переходами). 


Инструкции, не предусматривающие ветвления, выполняются схемой процессора 
под контролем устройства управления. 


В некотором смысле для управления выполнением инструкций без ветвления уст- 
ройство управления использует способ, аналогичный мельнице аналитической ма- 
шины (см. главу Г), за исключением того, что вместо штифтов на вращающемся 
барабане для зацепления частей механизма мельницы устройство управления ис- 
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пользует декодированные биты опкода инструкции для задействования определен- 
ных частей цифровой схемы. Выбранные компоненты схемы выполняют задачи, 
требуемые инструкцией. 


Процесс выполнения команды может включать в себя такие действия, как чтение 
или запись регистра, чтение или запись ячейки памяти, указание АЛУ выполнить 
математическую операцию и другие действия. 


В большинстве процессоров выполнение одной инструкции занимает несколько 
тактовых циклов. Количество циклов для выполнения инструкции может меняться 
в широких пределах — от простых инструкций, требующих небольшого количества 
тактов, до сложных операций, выполнение которых занимает много циклов. Уст- 
ройство управления координирует всю эту деятельность. 


Схемы, управляемые устройством управления, построены из простых логических 
вентилей, рассмотренных в главе 2, и часто включают в себя элементы более высо- 
кого уровня, такие как мультиплексоры, защелки и триггеры. Мультиплексоры, 
в частности, обычно используются логикой устройства управления для выборочной 
маршрутизации данных в заданное место назначения. 


Выполнение инструкции — простой пример 


Рассмотрим упрощенный пример выполнения двух инструкций процессора 6502: 
ТХА и ТУА. ТХА копирует содержимое регистра Х в регистр А, а Т\А делает то же самое, 
используя в качестве источника регистр У. Если мы рассмотрим эти две инструк- 
ции отдельно от прочих, то их выполнение может быть реализовано, как показано 
на рис. 3.3. 


Регистр Х 


(©) 


Мультиплексор 


Выбор Регистр А 


Регистр У 


СК 


Рис. 3.3. Инструкции ТХА и ТУА процессора 6502 


В схеме на рис. 3.3 предполагается, что регистры Х и У построены на основе 
Р-триггеров (как на рис. 2.14), за исключением того, что в процессоре 6502 они 
представляют собой 8-битные регистры, а не 4-битные. Мультиплексор реализован 
в виде восьми копий одноразрядного мультиплексора с двумя входами, как на 
рис. 2.9. Для управления всеми копиями используется один общий вход выбора. На 
рис. 3.3 более толстые линии представляют 8-разрядные шины данных, а более 
тонкие линии — отдельные логические сигналы. Короткие штрихи, пересекающие 
толстые линии с цифрой 8 над ними, указывают количество битов в шине. 
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Для выполнения инструкции ТХА предпринимаются следующие шаги: 


1. Сначала устройство управления подает на вход Выбор сигнал для передачи на 
выход мультиплексора битов данных регистра Х. Данные из регистра Х посту- 
пают на вход регистра А. 


2. После подачи сигнала на вход Выбор мультиплексора устройство управления 
должно выдержать паузу, чтобы биты данных достигли выходов мультиплексора. 


3. После стабилизации выходных сигналов мультиплексора устройство управле- 
ния генерирует сигнал СЁК, по фронту которого биты данных регистра Х за- 
гружаются в регистр А. 


Для выполнения инструкции ТУ\А устройство управления выполняет ту же последо- 
вательность действий, за исключением того, что сначала оно должно подать на 
вход Выбор сигнал для передачи на выход мультиплексора данных регистра У. 


Это очень простой пример работы устройства управления с инструкциями, но он 
демонстрирует, что выполнение отдельной инструкции может состоять из несколь- 
ких этапов и способно задействовать лишь небольшую часть логических схем, 
имеющихся в процессоре. Устройство управления должно гарантировать, что ком- 
поненты процессора, не используемые для выполнения инструкции, находятся в 
режиме простоя. Это предотвращает вмешательство указанных компонентов в вы- 
полнение инструкции и сводит к минимуму энергопотребление. 


Арифметико-логическое устройство 


Арифметико-логическое устройство (АЛУ) выполняет арифметические и битовые 
операции под управлением устройства управления. Для выполнения операции АЛУ 
требует ввода значений данных, называемых операндами, вместе с кодом, указы- 
вающим на операцию, которая должна быть выполнена. Выходные данные АЛУ 
являются результатом операции. Операции АЛУ могут использовать в качестве 
входных данных один или несколько флагов процессора, таких как флаг переноса, 
а также устанавливать состояния флагов процессора в качестве выходных данных. 
В процессоре 6502 операции АЛУ меняют состояния флагов переноса, отрицания, 
нуля и переполнения. 


АЛУ — это комбинационная схема, которая подразумевает, что ее выходы обнов- 
ляются асинхронно, реагируя на изменения на входах. Кроме того, это устройство 
не сохраняет данные о предыдущих операциях. 


Для того чтобы выполнить инструкцию, затрагивающую АЛУ, устройство управ- 
ления передает в АЛУ входные данные, выдерживает паузу, чтобы учесть задержку 
прохождения сигнала по цепям АЛУ, а затем передает выходные данные АЛУ по 
адресу, указанному инструкцией. 


АЛУ содержит схему сумматора для выполнения операций сложения и вычитания. 
В процессоре с арифметикой в дополнительном коде вычитание можно реализовать 
путем выполнения отрицания в дополнительном коде для правого операнда и до- 
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бавления результата к левому операнду. С математической точки зрения, при вы- 
полнении вычитания таким образом выражение А -— В преобразуется в А + (-В). 


Как вы помните из главы [, отрицание в дополнительном коде для числа со знаком 
выполняется путем инвертирования всех битов в операнде и добавления | к резуль- 
тату. С учетом этой операции вычитание, представленное в виде А + (-В), превра- 
щается в А + (МОТ(В) + 1). 


Рассмотрение вычитания в этой форме должно прояснить использование флага пе- 
реноса в процессоре 6502 в сочетании с инструкцией $вС. Когда заимствование при 
вычитании отсутствует, флаг С обеспечивает добавление 1. При наличии заимство- 
вания сумма должна быть уменьшена на 1, что достигается путем обнуления флага С. 


Подводя итог, можно сказать, что в процессоре 6502 логика вычитания идентична 
логике сложения с тем единственным отличием, что операнд В в выражении А - В 
пропускается через набор вентилей НЕ для инвертирования всех восьми битов пе- 
ред подачей значения НЕ(В) на вход сумматора. 


На рис. 3.4 показано функциональное представление операций сложения и вычита- 
ния в процессоре 6502. 


Правый оператор 


Левый операнд 


8-разрядный 
сумматор 


0 
Е 


Мультиплексор 


СК 


Рис. 3.4. Операции сложения и вычитания в процессоре 6502 


Как и на рис. 3.3, на рис. 3.4 показано сильно упрощенное представление процессо- 
ра 6502, где имеются только те компоненты, которые участвуют в выполнении ин- 
струкций Арс и $8с. Вход Выбор на рис. 3.4 определяет тип операции: сложение или 
вычитание. Для сложения требуется выбрать верхний вход мультиплексора, а для 
вычитания — нижний. В архитектуре процессора 6502 регистр А всегда содержит 
левый операнд для операции вычитания. 


Входными данными для сумматора являются левый и правый операнды и флаг С. 
При выполнении инструкции АОС или $ВС устройство управления передает пра- 
вый операнд на входы данных мультиплексора и устанавливает вход Выбор 
мультиплексора в состояние, соответствующее выполняемой инструкции. После 
паузы, требуемой для прохождения сигнала через вентиль НЕ, мультиплексор и 
сумматор, устройство управления генерирует сигнал синхронизации, по фронту 
которого выходные данные сумматора фиксируются в регистре А и регистре фла- 
гов процессора. 
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Флаги процессора устанавливаются, как показано в следующем описании выполне- 
ния инструкции Адос или $ВС: 


»® С указывает на наличие переноса при сложении (С = 1) или заимствования 
при вычитании (С = 0); 


» Мсодержит значение бита 7 результата; 


» У указывает, произошло ли переполнение с учетом знака (У = 1, если про- 
изошло переполнение); 


» 7 равен 1, если результат равен нулю; в противном случае 2, равен 0. 


Помимо сложения и вычитания двух чисел АЛУ поддерживает множество других 
операций. В процессоре 6502 для большинства операций с двумя операндами ле- 
вый операнд помещается в регистр А. Правый операнд либо считывается из ячейки 
памяти, либо предоставляется в виде непосредственного значения в ячейке памяти, 
следующей после кода операции. В процессоре 6502 все операнды и результаты 
АЛУ являются 8-битными значениями. Операции АЛУ процессора 6502: 


» АОС, $ВС — сложение или вычитание двух операндов со входом переноса; 

® ОЕС, ОЕХ, ОЕУ — уменьшение значения в ячейке памяти или регистре на единицу; 
® ШС, 1№Х, 1М — увеличение значения в ячейке памяти или регистре на единицу; 
® А№ — побитовая логическая операция И над двумя операндами; 

» ОВА — побитовая логическая операция ИЛИ над двумя операндами; 


» ЕОК — побитовая логическая операция "исключающее ИЛИ" над двумя опе- 
рандами; 


» А, 158 — сдвиг значения в регистре А или ячейке памяти влево или вправо 
на один разряд и вставка 0 в освободившуюся позицию; 


» К0ОЁ, КОК — вращение значения в регистре А или ячейке памяти влево или 
вправо на один разряд и вставка зт.ачения флага С в освободившуюся позицию; 


® СМР, СРХ, СРУ — вычитание одного операнда из другого и отбрасывание резуль- 
тата с установкой флагов М, Ди С в зависимости от результата вычитания; 


» втт— побитовая логическая операция И над двумя операндами и установка 
флага 7, чтобы указать, равен ли результат 0; кроме того, копирование битов 
7 и 6 левого операнда во флаги М и \У. 


Возможности АЛУ процессора 6502 ограничены по сравнению с более сложными 
современными процессорами, такими как семейство х86. 


Например, в 6502 операции умножения и деления программист должен реализовать 
в коде в виде повторяющихся операций сложения и вычитания. Кроме того, про- 
цессор 6502 может выполнять сдвиг или вращение значения в рамках одной инст- 
рукции всего на один разряд. 


В процессорах семейства х86, с другой стороны, инструкции умножения и деления 
реализованы непосредственно, а инструкции сдвига и вращения включают пара- 
метр, указывающий количество разрядов для сдвига в рамах одной инструкции. 
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АЛУ — это неизбежно сложное логическое устройство, что делает его идеальным 
кандидатом для проектирования с помощью языка описания аппаратных средств. 
Следующий листинг — это реализация на языке УНПГ, части АЛУ, подобного то- 
му, что применяется в процессоре 6502: 


-- Загрузка стандартных библиотек 

]16гагу ТЕЕЕ; 

у5е ТЕЕЕ.$ТО_1ОбТС_1164.АШЕ; 

уе ТЕЕЕ .МОМЕКТС_$ТО.АШ:; 

-- Определение входов и выходов 8-разрядного АЛУ 
епе1у АБУ 15 


роге ( 
-- Левый операнд 
ГЕРТ г м $44_1051с_меског(7 домпфо 0); 
-- Правый операнд 
АТОНТ т $49_1061с_уес®ог(7 домпфо 0); 
-- Операция АЛУ 
ОРСООЕ : м $44 1021с_\мес®ог(3 домпфо @); 
-- Перенос из предьдущего разряда 
С тм : м $44 1051с; 
-- Результат АЛУ 
ВЕЗИЕТ : О $44 _1]ор1с_уеског(7 4омпфо 0); 
-- Перенос В следующий разряд 
са : О $14 _1051с; 
-- Вывод флага знака 
м т : О $44 1ор1с; 
-- Вывод флага переполнения 
у т : О $%4_1051с; 
-- Вывод флага нуля 
2 ол : О $14_1051с 


); 
епа епЕ1у А|У; 


-- Определение поведения 8-разрядного АЛУ 
агсЬ1Фесфиге ВЕНАУТОКАЕ о АЁИ 15 
Беё1п 


РАШ : ргосез$$ (1ЕРТ, ВТСНТ, ОРСОБЕ, С_1М) 1$ 
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уаг1аб]е гези1+8 : чп$1епеа(7 домпфо 9); 
уаг1аб]е гези19 : ип$16епед(8 домпфо 0); 
уаг1аб]е г1ей ор : ип51етед(7 домпфо ©); 


бер1п 
сазе ОРСОБЕ 15 
энеп "0000" | "0001" => -- Сложение или вычитание 
1+ (ОРСОРЕ = "0000") «пеп 
ГЕН ор := ип$1епеа(ВТСНТ); -- Сложение 
е15е 
г1еЕРе ор := ип$1епед(по& КТСНТ); -- Вычитание 
епа 1+; 
гези119 := ('0'’ & ипз1втед(тЕЕТ)) + 
ип$1впе4(г1ЕА*_ор) + 
ип$1е160 ($4_1ор1с_мес®ог' (""& С_ТМ)); 
гези1{8 := гези149(7 домпфо 0); 


СО <= гези149(8); -- Флаг С 


-- Флаг У 
1+ (((1ЕРТ(7) ХОВ гези148(7)) = '1') АЮ 


((г1еИе_ор(7) ХОК гези1{8(7)) = '1')) +Пеп 


М ОТ <= '1'; 
е15е 
У от <= '0'; 
епа 1+; 
эпеп "0010" => -- Увеличение на 1 
ге5и1+8 := ип$1епед(тЕРТ) + 1; 
эпеп "0011" => -- Уменьшение на 1 
гези1{8 := ип$1епеа(тЕРТ) - 1; 
ипеп "0101" => -- Побитовая операция И 


гези148 := ип$1епеа(тЕРТ апа ВТбНТ); 
упеп "0110" => -- Побитовая операция ИЛИ 
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ге5и118 := ип$1рпеа(тЕЕТ ог КТ@НТ); 

эпеп "0111" => -- Побитовая операция исключающее ИЛИ 
ге5и1+8 := ип$1епед(ЕЕРТ хог КТбНТ); 

ипеп о*Кег$ => 
ге5и1+48 := (оЖВег$ => 'Х'); 


епа са5е; 


ВЕЗИЦЁТ <= $44 _1061<_мес®ог(гези1{ 8); 


МОТ <= гези1*8(7); => -- Флаг № 
1+ (ге$и1*8 = @) +Пеп -- Флаг 2 
ПОЛ <= '1'; 
е]1 зе 
7 ОТ <= '0'; 
епа 1+; 


еп ргосез$ Р_АУ; 


еп агсР1%есфиге ВЕНАУТОВАГ; 


Этот код определяет простое АЛУ как комбинационную схему с левым операндом, 
правым операндом, кодом операции и флагом С в качестве входных данных. Вы- 
ходными данными являются результат операции и флаги С, М, У ий. 


Далее мы рассмотрим назначение и функции регистров процессора. 


Регистры 


Регистры процессора — это внутренние области хранения данных, которые выпол- 
няют функции источников и мест назначения для операций, используемых для вы- 
полнения инструкций. Регистры обеспечивают наиболее быстрый доступ к данным 
в процессоре, но ограничены очень небольшим количеством ячеек памяти из-за их 
высокой стоимости с точки зрения площади матрицы. Разрядность регистра обычно 
совпадает с размером слова процессора. 


Процессор 6502, как мы уже видели, имеет только три 8-разрядных регистра: А, Х, 
и У. Процессоры семейства х86 имеют шесть 32-разрядных регистров для времен- 
ного хранения данных: ЕАХ, ЕВХ, ЕСХ, ЕОХ, Е5Т и ЕОТ. В архитектурах многих процессо- 
ров определенные регистры выделяются для передачи входных данных, требуемых 
определенными инструкциями. Например, в архитектуре х86 одна инструкция ВЕР 
МО\50 перемещает блок данных, длина которого (в словах) хранится в регистре ЕСХ, 


96 Глава 3 


начинающийся с адреса источника из регистра ЕТ, ПО адресу назначения из регист- 
ра Еот. 


При разработке новой архитектуры процессора крайне важно найти золотую сере- 
дину между количеством регистров и количеством и сложностью инструкций, дос- 
тупных процессору. Если взять кристалл интегральной схемы определенного раз- 
мера и определенной технологии изготовления (оба этих фактора ограничивают 
количество транзисторов, доступных для процессора), то добавление большего 
числа регистров в архитектуру уменьшает количество транзисторов, доступных для 
выполнения инструкций и других функций. С другой стороны, добавление инст- 
рукций со сложными возможностями способно ограничить пространство кристал- 
ла, доступное для регистров. Это противоречие между сложностью набора инст- 
рукций и количеством регистров выражается в отнесении архитектуры к категории 
СТС или ВТС. 


» Процессоры категории С1ЗС (сотр]ех шугисНоп $её сотршег — компью- 
тер с полным набором инструкций) характеризуются наличием обширного 
набора инструкций, поддерживающего множество функций, таких как воз- 
можность загружать операнды из памяти, выполнять операцию и сохранять 
результат в памяти, и все это с помощью одной инструкции. В процессоре 
С1$С выполнение инструкции может занять много тактов, пока процессор 
выполняет все необходимые подзадачи. Упомянутая выше инструкция 
ВЕРМОУО является примером инструкции с потенциально длительным време- 
нем выполнения. Процессоры СТС, как правило, имеют меньшее количество 
регистров, отчасти из-за того, что значительную площадь кристалла занима- 
ют схемные элементы, реализующие логику набора инструкций. Семейство 
процессоров х86 является классическим примером архитектуры СТС. 


» Процессоры категории В\$С (гедисед т$егисНоп 5её сотршег — компью- 
тер с сокращенным набором инструкций), напротив, имеют меньшее ко- 
личество инструкций, каждая из которых выполняет более простые задачи по 
сравнению с инструкциями процессоров СТС. Выполнение операции со зна- 
чениями данных, хранящимися в памяти, может потребовать пары инструк- 
ций для загрузки двух операндов из памяти в регистры, еще одной инструк- 
ции для выполнения операции и заключительной инструкции для записи 
результата операции в память. 


Ключевое различие между СТС и ВТЗС заключается в том, что архитектуры К1$С 
оптимизированы для выполнения отдельных инструкций с очень высокой скоро- 
стью. Несмотря на то что в ЕГЗС-процессоре для чтения данных из памяти, выпол- 
нение операции и записи результата в память требуется на несколько инструкций 
больше, чем в СГЗС-процессоре, общее время от начала до конца выполнения тех 
же операций может быть сопоставимым или даже меньшим в случае ВТ$С- 
процессора. Примерами категории ВТЗС могут служить архитектуры АКМ, кото- 
рые обсуждаются в главе 10, или архитектура КТЗС-У, рассматриваемая в главе 11. 


Упрощение набора инструкций в К!$С-процессорах оставляет больше места на 
кристалле для регистров, это означает, что в ВГЗС-процессорах обычно использует- 
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ся большее количество регистров по сравнению с С!$С-процессорами. Архитектура 
АКМ, например, имеет 13 регистров общего назначения, в то время как базовая 
32-разрядная архитектура ВТЗС-У — 31 регистр общего назначения. 


Большее количество регистров в архитектурах ВТ5С уменьшает потребность в дос- 
тупе к системной памяти, поскольку для хранения промежуточных результатов 
доступно больше регистров. Это повышает производительность системы, т. к. дос- 
туп к системной памяти занимает значительно больше времени, чем доступ к дан- 
ным, расположенным в регистрах процессора. 


Представьте себе регистр процессора как набор Д-триггеров, в которых каждый 
триггер содержит один бит данных регистра. Данные загружаются в каждый из 
триггеров регистра по общему тактовому сигналу. Данные для записи в регистр 
могут поступать в триггеры после прохождения через мультиплексор, который вы- 
бирает один из потенциально многих источников данных следуя указаниям выпол- 
няемой инструкции. 


В качестве альтернативы использованию мультиплексора для этой цели инструкция 
может загружать данные в регистр из шины передачи данных, внутренней по от- 
ношению к процессору. В этой конфигурации устройство управления организует 
работу внутренней шины таким образом, чтобы только нужный источник данных 
управлял линиями шины в момент прохождения фронта тактового сигнала, кото- 
рый загружает данные в регистр, в то время как всем другим источникам данных, 
подключенным к шине, запрещено размещать на ней данные. 


В следующих разделах будет представлен полный состав набора инструкций про- 
цессора и используемые инструкциями режимы адресации. 


Набор инструкций процессора 


Инструкции, аналогичные тем, что обсуждались выше, реализованы в большинстве 
архитектур процессоров общего назначения, однако возможности более сложных 
процессоров расширяют за счет дополнительных категорий инструкций. Более со- 
вершенные инструкции, доступные в архитектурах современных процессоров, бу- 
дут представлены в следующих главах. 


Процессоры СТЗС обычно поддерживают несколько режимов адресации. Они, в свою 
очередь, предназначены для эффективного доступа к последовательным ячейкам 
памяти, используемым программными алгоритмами, работающими на процессоре. 
В следующем разделе описываются режимы адресации инструкций, реализованные 
в процессоре 6502. Далее будут представлены категории инструкций процессора 
6502, большинство из которых применяются в архитектурах современных процес- 
соров. Затем мы рассмотрим специализированные инструкции для обработки пре- 
рываний и операций ввода-вывода, включая объяснение функций процессора, ко- 
торые обеспечивают высокопроизводительные операции ввода и вывода с блоками 
данных переменного размера. 
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Режимы адресации 


СТ$С-процессоры поддерживают несколько режимов адресации для инструкций, 
требующих передачи данных между памятью и регистрами. К$С-процессоры 
имеют ограниченное число режимов адресации. Каждая архитектура определяет 
свой набор режимов адресации на основе анализа предполагаемых моделей дос- 
тупа к памяти, которые программное обеспечение будет использовать в этой ар- 
хитектуре. 


Для того чтобы представить режимы адресации процессора 6502, в этом разделе 
используется простой пример кода 6502, складывающий четыре байта данных. Для 
того чтобы избежать излишних деталей, в примере игнорируется любой перенос из 
8-битной суммы. 


Режим непосредственной адресации 


При непосредственной адресации значение операнда следует в памяти сразу за ко- 
дом операции. Для первого примера предположим, что нам даны значения четырех 
байтов для сложения и предложено написать для процессора 6502 программу, ре- 
шающую эту задачу. Такая постановка задачи позволяет нам вводить байтовые 
значения непосредственно в наш код. Байты в этом примере — от $61 до $64. Мы 
будем складывать байты в обратном порядке (от $04 до $01), предполагая дальней- 
ший переход к использованию циклической конструкции, которая будет представ- 
лена в данном разделе позже. В этом коде для сложения четырех байтов использу- 
ется режим непосредственной адресации: 


; Сложение четырех байтов с использованием режима непосредстденной адресации 
ГРА #$604 

СС 

АОС #$03 

АОС #$02 

АОС #$01 


Обратите внимание, что комментарии на языке ассемблера начинаются с точки с 
запятой. После выполнения этих инструкций регистр А будет содержать значение 
$еА — сумму четырех байтов, указанных в качестве операндов. 


Вспомните главу 1 — там было сказано, что в языке ассемблера 6502 непосредст- 
венному значению предшествует символ #, а символ $ указывает, что значение яв- 
ляется шестнадцатеричным. Непосредственно адресованный операнд считывается 
из ячейки памяти по адресу, следующему за кодом операции инструкции. Непо- 
средственная адресация удобна тем, что при ее использовании нет необходимости 
резервировать ячейку памяти, из которой следует считать операнд. Однако режим 
непосредственной адресации полезен только в том случае, если значение данных 
известно во время написания программы. 
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Режим абсолютной адресации 


В режиме абсолютной адресации, иногда называемом режимом прямой адреса- 
ции, указывается ячейка памяти, содержащая значение, которое будет считано или 
записано инструкцией. В процессоре 6502 предусмотрены 16 адресных битов, по- 
этому адресное поле, поддерживающее доступ ко всей доступной памяти, имеет 
длину 2 байта. Полная инструкция для доступа к данным в произвольной ячейке 
памяти процессора 6502 состоит из трех байтов: первый байт — это код операции, 
за ним следуют два байта с адресом ячейки памяти для считывания или записи. При 
сохранении двух байтов адреса первым располагается младший байт, а за ним сле- 
дует старший байт. Старший байт 16-разрядного значения содержит 8 старших зна- 
чащих битов, а младший байт — 8 младших значащих битов. 

Благодаря принятому соглашению о хранении младшего байта двухбайтового адре- 
са по меньшему адресу памяти 6502 является процессором с прямым порядком 
байтов (|1 е-епд1ап). В процессорах семейства х86 также принят прямой порядок 
байтов. Архитектуры АКМ и В!$С-У позволяют программным образом выбирать 
режим прямого или обратного порядка следования байтов (переключаемый поря- 
док байтов (51-епд1аппез$)), но большинство операционных систем, работающих на 
этих архитектурах, выбирают режим с прямым порядком байтов. 


Пример режима абсолютной адресации мы начнем с некоторого подготовительного 
кода для сохранения четырех байтов, которые будут складываться, по адресам от 
$200 до $203. За подготовительным кодом следуют инструкции для сложения этих 
четырех байтов. В этом примере для сложения четырех байтов применяется режим 
абсолютной адресации: 


; Инициализация данных 6 памяти 
(ФА #$04 

ТА $0203 

1ОА #$03 

ЗТА $0202 

ЕРА #$02 

ЗТА $0201 

ГОА #$@1 

$ТА $0200 

; Сложение четырех байтов с использованием режима абсолютной адресации 
ГОА $0203 

СЕС 

АБС $0202 

АОС $0201 

АБС $0200 


В отличие от режима непосредственной адресации, абсолютная адресация позволя- 
ет суммировать четыре значения, которые не известны до выполнения программы: 
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инструкции АБС складывают любые значения, сохраненные в ячейках $200-$203. 
Ограничение этого режима адресации заключается в том, что при написании про- 
граммы необходимо указать адреса складываемых байтов. Этот код не может скла- 
дывать байты, расположенные в произвольном месте в памяти. 


Недостатком нашего простого примера является использование избыточной после- 
довательности почти идентичных инструкций. Для того чтобы этого избежать, 
обычно желательно поместить повторяющуюся часть кода в циклическую конст- 
рукцию. В следующих двух примерах используется режим адресации 6502, кото- 
рый облегчает выполнение циклических операций, хотя мы не будем добавлять в 
код цикл до второго примера. | 


Режим абсолютной индексной адресации 


В режиме абсолютной индексной адресации адрес ячейки памяти вычисляется 
путем добавления к базовому адресу, указанному в инструкции, значения, содер- 
жащегося в регистре Х или У. В следующем примере с помощью абсолютной ин- 
дексной адресации складываются байты по адресам от $0200 до $0263. Регистр Х 
предоставляет смещение от начала массива байтов по адресу $0260: 


; Инициализация данных В памяти 
ГРА #$04 

$ТА $0203 

ГРА #$03 

ТА $0202 

ГРА #$02 

ТА $0201 

ГРА #$01 

ТА $0200 

; Сложение четырех байтов с использованием режима абсолютной индексной адресации 
их #$03 

СЕС 

ГОА $0200, Х 

ОЕХ 

АОС $0200, Х 

ОЕХ 

АОС $0200, Х 

ОЕХ 

АБС $0200, Х 


Инструкция БЕХ уменьшает значение в регистре Х на единицу (вычитает из него 1). 
Этот код ухудшает решение с точки зрения увеличения количества инструкций, 
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необходимых для сложения четырех байтов, однако мы видим, что последователь- 
ность из инструкции ОЕХ и следующей за ней инструкции АбС $6200, Х теперь повто- 
ряется три раза. 

Мы можем использовать условное ветвление для выполнения этой последователь- 
ности сложения в цикле: 


; Инициализация данных В памяти 
ГРА #$04 

ТА $0203 

ГРА #$03 

ТА $0202 

ГРА #$02 

ЗТА $0201 

ГРА #$01 

ТА $0200 

; Сложение четырех байтов с использованием режима абсолютной индексной адресации 
ьох #$03 

ГРА $0200, Х 

БЕХ 

СЕС 

АБО 1ООР: 

АОС $0200, Х 

ОЕХ 

ВРЕ АБО 1ООР 


Инструкция ВРЕ (ветвление при плюсе) осуществляет условную передачу управле- 
ния инструкции, перед которой стоит метка АБО 100Р. ВРЕ выполняет это ветвление 
только тогда, когда флаг М процессора равен нулю. Если флаг М установлен, инст- 
рукция ВР передает управление следующей инструкции в памяти. 


Может показаться, что код в этом примере не стоил усилий, затраченных на созда- 
ние цикла лишь для того, чтобы сложить четыре байта. Но обратите внимание, что 
эту версию кода можно изменить для сложения 100 последовательных байтов про- 
стым изменением операнда инструкции 0х. Изменение предыдущего примера для 
сложения 100 байтов таким же образом потребовало бы намного больше работы, 
и инструкции потребляли бы гораздо больше памяти. 


Этот пример имеет те же ограничения, что и пример для режима абсолютной адре- 
сации — в обоих случаях задается начало массива байтов в ячейке памяти, опреде- 
ленной во время написания программы. Следующий режим адресации устраняет 
это ограничение и складывает массив байтов, начиная с любого адреса в памяти. 
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Режим косвенной индексной адресации 


Режим косвенной индексной адресации использует двухбайтовый адрес, храня- 
щийся в диапазоне адресов памяти $00-$ЕЕ, в качестве базового адреса и добавляет 
содержимое регистра У к этой базе для получения адреса памяти, используемого 
инструкцией. В следующем примере базовый адрес массива байтов ($0200) предва- 
рительно сохраняется по адресам $0016 и $0011 с соблюдением прямого порядка 
байтов. Следующий код использует для сложения байтов косвенную индексную 
адресацию в цикле: 


; Инициализация данных 6 памяти 
ГРА #$04 

$ТА $0203 

ТА #$03 

ТА $0202 

ГОА #$02 

$ТА $@201 

ГРА #$01 

ТА $0200 

; Инициализация указателя на массив байтов 
|РА #$00 

ЗТА $10 

ГОА #$02 

ЗТА $11 

; Сложение четырех байтов с использованием режима косвенной индексной адресации 
ГОУ #$03 

ГрА ($19), У 

ОЕУ 

СС 

АОО_1ООР: 

АОС ($19), У 

ОЕУ 

ВРЕ АОО_1ООР 


При косвенной индексной адресации перед выполнением кода сложения можно 
сохранить любой адрес в памяти по адресам $10-$11. Обратите внимание, что при 
косвенной индексной адресации для хранения смещения адреса необходимо ис- 
пользовать регистр У. Регистр Х недоступен для применения в этом режиме адре- 
сации. 


В процессоре 6502 предусмотрены и некоторые иные режимы адресации: режим 
адресации по нулевой странице (абсолютной и абсолютной с индексированием) 
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позволяет использовать инструкции, которые имеют меньшую длину (на один 
байт) и выполняются быстрее за счет работы только с адресами памяти в диапазоне 
$00-$ЕЕ. Термин "нулевая страница" связан с тем, что для адресов в этом диапазоне 
старший байт 16-разрядного адреса равен нулю. Помимо улучшения производи- 
тельности за счет более высокой скорости выполнения и уменьшения занимаемой 
кодом памяти, режимы адресации по нулевой странице действуют так же, как и со- 
ответствующие режимы адресации, описанные ранее. 


Другой режим называется режимом индексной косвенной адресации‘ — он по- 
хож на режим косвенной индексной адресации, за исключением того, что вместо 
регистра У используется регистр Х, а смещение, содержащееся в регистре Х, до- 
бавляется к адресу, указанному в инструкции, для определения адреса указателя на 
данные. Например, предположим, что регистр Х содержит значение 8. Инструкция 
ГОА ($10, Х) добавляет $19 к содержимому регистра Х, что дает в результате $18. За- 
тем эта инструкция использует 16-разрядный адрес памяти, считанный из памяти 
по адресам $18-$19, в качестве адреса целевой ячейки памяти для загрузки значения 
в регистр А. 


Индексная косвенная адресация не имеет отношения к нашему примеру суммиро- 
вания последовательности байтов. Одним из примеров применения этого режима 
является выбор значения из последовательного списка указателей, где каждый ука- 
затель содержит адрес строки символов. Регистр Х может ссылаться на одну из 
этих строк как на смещение от начала списка указателей. Такая инструкция, как 
ОА ($10, Х), загружает в регистр А адрес выбранной строки. 


Режимы адресации, доступные в архитектурах процессоров С[ЗС и, в меньшей сте- 
пени, в архитектурах К[$С, обеспечивают поддержку эффективных методов досту- 
па к различным типам структур данных в системной памяти. 


В следующем разделе обсуждаются категории инструкций, реализованные в архи- 
тектуре процессора 6502, а также использование каждой инструкцией доступных 
режимов адресации. 


Категории инструкций 


В этом разделе представлены категории инструкций, реализованные в процессоре 
6502. Цель обсуждения процессора 6502 здесь состоит в том, чтобы представить 
концепции, связанные с набором инструкций более простой процессорной архитек- 
туры, чем у современных 32- и 64-разрядных процессоров, которые мы рассмотрим 
в следующих главах. К тому времени, когда мы доберемся до этих процессоров, 
базовые концепции набора инструкций должны быть вам хорошо знакомы. 


' Режимы индексной косвенной адресации и косвенной индексной адресации названы по 
аналогии с английскими названиями, выбранными автором ("шдехе4 ш4игес! адагез тр" и 
"шашесе тдехе4 адагеззтр"), их названия не отражают отличий между ними. — Пер. 
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Инструкции загрузки и сохранения 


Процессор 6502 использует инструкции загрузки из памяти и сохранения в память 
для считывания значений данных из системной памяти в регистры процессора и 
для записи содержимого регистров в системную память. В архитектуре 6502 инст- 
рукции ТА, 10Х и 10\ загружают в регистр, указанный в их названии, 8-разрядное 
слово из системной памяти. Инструкция 1А поддерживает все режимы адресации, 
доступные в 6502, а ШХ и оу — лишь часть режимов адресации: непосредственную, 
абсолютную и абсолютную индексную. 


После завершения выполнения каждой из этих инструкций флаги М и 2 указывают, 
является ли загруженное значение отрицательным (по установленному биту 7) и 
равно ли это значение нулю. 


Инструкции $ТА, $ТХ и $ТУ записывают в память содержимое регистра, указанного в 
их названиях. Каждая инструкция сохранения поддерживает те же режимы адреса- 
ции, что и инструкция загрузки для этого регистра, за исключением режима непо- 
средственной адресации. Эти инструкции обновляют состояние флагов М и Й, от- 
ражая свойства сохраненного значения. 


Инструкции передачи данных из регистра в регистр 


Эти инструкции копируют 8-битное слово одного регистра (А, Х или У) в другой 
регистр. Данные инструкции используют режим неявной адресации, т. е. источ- 
ник и адресат каждой инструкции указываются непосредственно кодом операции 
инструкции. 


Инструкция ТАХ копирует содержимое регистра А в регистр Х. Инструкции ТА\, ТХА 
и Т\А выполняют аналогичные операции между парами регистров, указанными в их 
названиях. Эти инструкции обновляют состояние флагов Ми 7. 


Инструкции стека 


Инструкция тх$ копирует содержимое регистра Х в регистр указателя стека (5). Она 
должна использоваться для инициализации регистра $ во время запуска системы. 
Инструкция тТ$Х копирует содержимое регистра $ в регистр Х и обновляет состоя- 
ние флагов Ми 7. Выполнение инструкции ТХ$ не оказывает влияния на какие-либо 
иные флаги. 


Инструкция РНА помещает в стек содержимое регистра А. Инструкция РНР помещает 
в стек флаги процессора в виде 8-битного слова. Эти инструкции не влияют на фла- 
ги процессора. Помещение значения в стек состоит из записи содержимого регист- 
ра в ячейку памяти по адресу, вычисленному путем добавления $100 к содержимому 
‚регистра 5, и последующего уменьшения значения регистра $ на единицу. 


Инструкции Р\А и РЕР извлекают значение из стека и помещают его в регистр А или 
регистр флагов, соответственно. При извлечении значения к содержимому регистра 
$ сначала добавляется единица, после чего в целевой регистр передается значение 
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из ячейки памяти по адресу, вычисленному путем добавления $100 к содержимому 
регистра 5. 


Инструкция РЕА обновляет состояние флагов М и 7. Инструкция РЕР устанавливает 
или обнуляет шесть из семи флагов процессора в зависимости от значения, извле- 
ченного из стека. Флаг В (флаг программного прерывания) имеет смысл только в 
копии регистра флагов процессора, которая была помещена в стек прерыванием 
или инструкцией РНР. Это отличает инструкцию ВВК от запроса аппаратного преры- 
вания. Обе инструкции, РНР и ВВК, передают регистр флагов с установленным битом В 
(бит 4). 


Аппаратные прерывания, генерируемые процессором на выводах ВО (Пщепари 
Кедие${ — запрос на прерывание) и ММГ (№ №п-Мазкае ПцеггарЕ — немаскируе- 
мое прерывание), передают регистр флагов процессора с обнуленным битом В. Об- 
работка прерываний и инструкция ВВК будут рассмотрены позже в этой главе. 


Арифметические инструкции 


Как мы уже видели, сложение и вычитание выполняются с помощью инструкций 
АОС и $8С. Левым операндом каждой инструкции выступает содержимое регистра А, 
который также является местом назначения для результата операции. Для указания 
правого операнда доступны все режимы адресации. Значения флагов 2, С, Ми У 
обновляются, отражая результат операции. 


Инструкции 1 и БЕС, соответственно, увеличивают или уменьшают значение в 
указанной ячейке памяти на единицу. Результат сохраняется в той же ячейке памя- 
ти. Поддерживаются режимы абсолютной адресации и абсолютной индексной ад- 
ресации. Эти инструкции обновляют состояние флагов М и 1 в зависимости от ре- 
зультата операции. 


Инструкции тТ№Х, ОЕХ, ТМУ и ОЕУ увеличивают или уменьшают значение в регистре Х 
или У на единицу, согласно их названиям. Эти инструкции обновляют состояние 
флагов Ми 7. 


Инструкция СМР выполняет сравнение путем вычитания значения операнда из зна- 
чения в регистре А. Поведение инструкции СМР очень похоже на последователь- 
ность, в которой за инструкцией $ЕС следует инструкция $ВС. Значения флагов М, 2 
и С обновляются, отражая результат вычитания. Различия между инструкциями смР 
и $8С состоят в следующем: 


» СМР отбрасывает результат вычитания (выполнение инструкции СМР не влияет 
на значение в регистре А); 


® СМР не использует десятичный режим, если установлен флаг О; 
® СМР не влияет на состояние флага У; 
® СМР поддерживает все режимы адресации. 


Инструкции СРХ и СРУ ПОХОЖИ На СМР, за исключением того, что содержимое регистра 
Х или У используется в качестве левого операнда, согласно названию инструкции, 
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а для правого операнда поддерживаются только режимы абсолютной адресации и 
абсолютной индексной адресации. 


Логические инструкции 


Инструкции АЮ, ЕОВ и ОКА выполняют побитовые операции И, "исключающее ИЛИ" 
и ИЛИ, соответственно, между регистром А и операндом. Результат сохраняется в 
регистре А. Значения флагов Г, и М обновляются, отражая результат операции. 
Поддерживаются все режимы адресации. 


Инструкция А$Е выполняет сдвиг операнда на один бит влево, вставляя 0 в младший 
бит. Старший бит сдвигается в флаг С. Это эквивалент умножения значения в реги- 
стре А на 2 и переноса старшего бита 9-битного результата в С. 


Аналогично АбЕ инструкция 158 выполняет сдвиг операнда на один бит вправо, 
вставляя 0 в старший бит. Младший бит сдвигается в флаг С. Это эквивалентно де- 
лению беззнакового операнда на 2 со сдвигом остатка в С. 


Инструкции ВоЕ и ВОВ сдвигают содержимое регистра А на один бит влево или впра- 
во соответственно. Предыдущее значение флага С переносится в позицию разряда, 
освободившегося в результате операции сдвига. Бит, выпадающий в результате 
сдвига из регистра А, сохраняется во флаге С. 


Инструкции АЗ, 158, ВОЕ и ВОВ поддерживают режим адресации аккумулятора, 
в котором в качестве операнда используется регистр А. Этот режим задается с по- 
мощью специального операнда со значением "А", как в инструкции АЕ А. Эти че- 
тыре инструкции также поддерживают режимы абсолютной адресации и абсолют- 
ной индексной адресации. 


Инструкция ВТ выполняет побитовую операцию И между операндом и регистром А, 
результат при этом отбрасывается. Состояние флага 7, обновляется в зависимости 
от результата операции. Биты 7 и 6 из ячейки памяти копируются во флаги Ми У 
соответственно. Поддерживается только режим абсолютной адресации. 


Инструкции ветвления 


Инструкция ЭМР загружает операнд в ПС, и выполнение программы продолжается с 
инструкции в указанном месте. Адрес назначения, двухбайтовый абсолютный ад- 
рес, может находиться в любом месте адресного пространства процессора 6502: 


» инструкции всс и вс$ выполняют условное ветвление, если флаг С обнулен 
или установлен, соответственно; 


» инструкции ВМЕ и ВЕО выполняют условное ветвление, если флаг 7, обнулен 
или установлен, соответственно; 


® инструкции ВРЕ и ВМТ выполняют условное ветвление, если флаг М обнулен 
или установлен, соответственно, 


» инструкции в\С и В\5 выполняют условное ветвление, если флаг У обнулен 
или установлен, соответственно. 
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Инструкции условного ветвления используют режим относительной адресации, 
где целевой адрес представляет собой 8-битное смещение со знаком (в диапазоне от 
—128 до +127 байт) от адреса инструкции, следующей за инструкцией ветвления. 


Инструкции вызова подпрограммы 
и возврата из подпрограммы 


Инструкция 258 передает в стек адрес инструкции, следующей за инструкцией 258 
(минус один), загружает адрес, указанный в качестве 16-разрядного операнда, в ПС, 
а затем продолжает выполнение программы, начиная с инструкции в этом местопо- 
ложении. 


Инструкция ВТ$ используется для завершения подпрограммы. Возвращаемое значе- 
ние ПС (минус один) извлекается из стека и загружается ПС. Данная инструкция 
увеличивает значение ПС на единицу до того, как оно будет использовано в качест- 
ве адреса следующей команды для выполнения. 


Инструкции для работы с флагами процессора 


Инструкции для работы с флагами процессора предназначены для непосредствен- 
ной установки или обнуления отдельных флагов. 


® Инструкции $ЕС и СЕС устанавливают и обнуляют флаг С, соответственно. 
» Инструкции $Е0 и С! устанавливают и обнуляют флаг О, соответственно. 
® Инструкция С/\ обнуляет флаг У. 


Ни одна из инструкций не устанавливает флаг У. 


Инструкции для работы с прерываниями 


Инструкции для работы с прерываниями позволяют процессору управлять обра- 
боткой внешних прерываний и генерировать собственные программные прерыва- 
ния. Внешние прерывания могут быть двух типов: маскируемые и немаскируемые. 
Прерывания каждого типа запускаются с помощью выделенного для этой цели 
входного контакта на процессоре 6502. 


Маскируемые прерывания можно отключить, установив флаг [ процессора. При 
маскировании процессор игнорирует сигнал на соответствующем входном контак- 
те. Немаскируемые прерывания, как следует из их названия, не могут быть забло- 
кированы и всегда инициируют прерывание процессора, когда на соответствующем 
контакте обнаруживается соответствующий переход сигнала. Обработку прерыва- 
ний мы рассмотрим более подробно в следующем разделе. 


Инструкции $ЕТ и СИТ устанавливают и обнуляют флаг |, соответственно. Когда 
флаг [ установлен, маскируемые прерывания отключены или маскированы. 


Инструкция ВВК генерирует немаскируемое прерывание. Адрес памяти через два 
байта после инструкции ВВК помещается в стек, за ним следует регистр флагов про- 
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цессора. В ПС загружается адрес обработчика прерываний, который считывается 
по адресам $ЕЕЕЕ-ФЕЕЕЕ. Затем запускается выполнение обработчика прерываний. 


Инструкция ВВК не изменяет содержимое регистров (кроме указателя стека) или 
флагов процессора. Бит В регистра флагов, помещенного в стек, установлен, ука- 
зывая на то, что прерывание является результатом выполнения инструкции ВВК. 


Инструкция КТГ выполняет возврат из обработчика прерываний. Эта инструкция 
восстанавливает флаги процессора из стека, а также восстанавливает состояние ПС. 
После восстановления флагов процессора флаг В теряет свое значение, и его следу- 
ет игнорировать. 


Обработка прерываний и использование инструкции ВАК будут обсуждаться в 
р рер тру уду у 
разд. "Обработка прерываний" далее в этой главе. 


Инструкция отсутствия операций 


Инструкция №Р (которую также часто называют по-ор) ничего не делает, кроме пе- 
ревода ПС к следующей инструкции. 


Инструкции №Р иногда используются при разработке программ в качестве средства 
отладки. Например, одну или несколько инструкций можно эффективно "заком- 
ментировать", заполнив адреса памяти для этих инструкций байтами $ЕА. $ЕА — это 
шестнадцатеричное значение кода операции №Р в процессоре 6502. 


Обработка прерываний 


Процессоры обычно поддерживают некоторую форму обработки прерываний для 
реагирования на запросы обслуживания от внешних устройств. Концептуально об- 
работка прерываний напоминает сценарий, в котором вы заняты решением некото- 
рой задачи, и ваш телефон звонит. После ответа на вызов и, возможно, записи за- 
метки для последующего действия (например, "купить хлеб") вы возвращаетесь к 
прерванной работе над задачей. Люди используют несколько подобных механиз- 
мов, таких как дверные звонки и будильники, которые позволяют нам прерывать 
менее приоритетные действия и реагировать на более насущные потребности. 


Обработка ва 


Интегральная схема 6502 имеет два входа для сигналов, с помощью которых внеш- 
ние компоненты уведомляют процессор о необходимости уделить внимание опре- 
деленным событиям. Первый — это вход запроса на прерывание, ВО (Пщеггар 
КеОчце$®. Вход ЩО является инверсным, т. е. вызывает прерывание процессора 
при низком уровне (это означает, что сигнал считается активным при низком 
уровне или в состоянии 0, на что указывает линия над символами ВО). Можно 
представить этот сигнал как телефонный звонок, уведомляющий процессор о 
входящем вызове. 
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Процессор 6502 не может мгновенно реагировать на низкий уровень сигнала на 
входе ВО. Прежде чем процессор 6502 сможет приступить к обработке прерыва- 
ния, он должен завершить работу над уже выполняемой инструкцией. Затем он по- 
мещает в стек адрес возврата (адрес следующей инструкции, которая должна была 
быть выполнена после текущей инструкции), за которым следует регистр флагов 
процессора. Так как это прерывание было сгенерировано с помощью входа ВО, 
флаг В в строке флагов процессора, помещенной в стек, будет равен 0. 


В отличие от инструкции 358, адрес возврата, помещенный в стек в ответ на сигнал 
со входа ВО, является фактическим адресом следующей инструкции, которая 
должна быть выполнена, а не адресом инструкции за вычетом единицы. Адрес воз- 
врата после прерывания не будет увеличиваться на единицу, как это происходит 
при формировании адреса возврата во время выполнения инструкции ВТ<. 


На следующем этапе обработки прерывания процессор загружает в ПС адрес про- 
граммы обработки ПВО, который считывается из памяти по адресам $ЕЕЕЕ-$ФЕЕЕЕ. 
Затем процессор 6502 начинает выполнение кода обработчика прерывания по это- 
му адресу. Обработчик прерывания — это код, который идентифицирует перифе- 
рийное устройство, инициировавшее прерывание, и выполняет обработку, необхо- 
димую для удовлетворения запроса, а затем возвращает управление коду, который 
выполнялся до прерывания. 


По завершении работы обработчика прерываний процессор выполняет инструкцию 
тт. Она извлекает флаги процессора и состояние ПС из стека, после чего процессор 
возобновляет выполнение программы, начиная с инструкции, которая следовала за 
текущей инструкцией при переходе сигнала на входе ВО на низкий уровень. 


Вход ВО генерирует маскируемое прерывание, означающее, что в этом случае 
можно выполнить действие, эквивалентное отключению звука при поступлении 
телефонного вызова. Когда начинается обработка прерывания ВО, процессор 
6502 автоматически устанавливает флаг |, который маскирует (отключает) вход 
ГКО до снятия этого флага. 


Флаг [ обнуляется, когда инструкция КТТ восстанавливает флаги процессора, по- 
скольку этот флаг не мог быть установлен в момент реагирования процессора на 
сигнал О. Флаг [ также можно снять с помощью инструкции с1т — это означает, 
что при обработке одного прерывания ВО можно разрешить реагирование на дру- 
гие прерывания ВО. Прерывание, обрабатываемое во время обработки другого 
прерывания, называется вложенным прерыванием. 


Вход ВО — это устройство, запускаемое по уровню сигнала. Это означает, что 
каждый раз, когда сигнал на входе ВО переходит на низкий уровень и флаг | снят, 
процессор инициирует последовательность обработки прерывания. Одно из следст- 
вий этого заключается в том, что по завершении обработки прерывания взаимодей- 
ствие процессора 6502 с источником прерывания должно гарантировать отсутствие 
низкого уровня сигнала на входе КО. Если сигнал на входе ВО останется низ- 
ким на момент выполнения инструкции Втт, процессор 6502 сразу же начнет про- 
цесс обработки прерывания заново. Обработка прерываний, инициируемых со вхо- 
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да ВО , покрывает большинство рутинных операций взаимодействия между про- 
цессором 6502 и периферийными устройствами. Например, в большинстве компь- 
ютеров источником прерываний является клавиатура. 


Каждое нажатие клавиши генерирует прерывание КО. Во время обработки пре- 
рывания клавиатуры процессор 6502 считывает идентификатор нажатой клавиши 
через интерфейс клавиатуры и сохраняет его в очереди для последующей обработ- 
ки активным в данный момент приложением. Коду обработчика прерываний КО 
не требуется информация о том, для чего будут использоваться данные о нажатии 
клавиши; он просто сохраняет их для последующего использования. 


Обработка ММ! 


Второй вход прерываний процессора 6502, ММГ (№ №п-МазКае Пиегир®, предна- 
значен для немаскируемых прерываний. Как следует из его названия, вход ММ 
не маскируется с помощью флага 1. ММГ — это устройство, запускаемое по спаду 
сигнала. 


Обработка прерываний ММГ выполняется аналогично обработке прерываний КО, 
за исключением того, что адрес процедуры обработки прерываний считывается из 
памяти по адресам $ФЕЕРА-$ФЕЕЕВ, а флаг [ не оказывает влияния на прерывания этого 
типа. 


Так как прерывание ММГ является немаскируемым, оно может произойти в любое 
время, включая момент, когда процессор 6502 занят обработкой прерывания ВО 
или даже обработкой произошедшего ранее прерывания ММГ. 


Вход ММГ обычно зарезервирован для событий с очень высоким приоритетом, ко- 


торые нельзя отложить или пропустить. Один из возможных вариантов применения 
прерываний ММГ — увеличение значения счетчика часов реального времени. 


Приведенный ниже пример кода обработки ММГ увеличивает значение 32-разряд- 
ного счетчика времени, размещенного по адресам $10-$13, каждый раз, когда про- 
исходит это прерывание: 


; Увеличение значения 32-разрядного счетчика времени при каждом прерывании /МТ 
ММТ_НАМОЕЕВ: 
1% $19 

ВМЕ ММТ_ООМЕ 
ТА $11 

ВМЕ ММТ_ООМЕ 
ТА $12 

ВМЕ ММТ_ООМЕ 
1% $13 
ММТ_ООМЕ: 
КТТ 
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При обращении к аппаратным сигналам в исходном коде программы для обозначе- 
ния сигнала с активным низким уровнем можно использовать в начале прямую ко- 
сую черту. В комментарии к показанному выше примеру кода прерывание ММ! 
обозначено как /мМТ. 


Обработка инструкции ВВК 


Инструкция ВВК запускает обработку, которая очень похожа на обработку прерыва- 
ния КО. Так как ввк — это инструкция, перед началом обработки прерывания не 
требуется ждать завершения выполнения текущей инструкции. При выполнении 
инструкции ВВК адрес возврата (адрес инструкции ВВК плюс 2) и флаги процессора 
помещаются в стек, как при переходе сигнала на входе ВО на низкий уровень. 
Обратите внимание, что при добавлении 2 к адресу инструкции ВВК адрес возврата 
указывает не на первый, а на второй байт после инструкции ввк. Инструкция ВВК 
является немаскируемой: состояние флага [ не влияет на ее выполнение. 


Обработчик инструкции ВВК имеет тот же адрес, что и обработчик КО, который 
находится в памяти по адресам $ЕЕЕЕ-ФЕЕЕЕ. Поскольку инструкция ВВК и ЩО ис- 
пользуют один и тот же обработчик, определить источник прерывания во время 
обработки можно по состоянию флага В. Флаг В в слове флагов процессора, поме- 
щенном в стек (это не флаг В в регистре флагов процессора Р), устанавливается при 
выполнении инструкции ВВК и обнуляется при обработке прерывания ВО. 


Инструкция ввк отсутствует в большинстве приложений процессора 6502. Тради- 
ционно эта инструкция применяется для установки контрольных точек при отладке 
программы. Путем временной замены байта кода операции в месте, где требуется 
разместить контрольную точку, на инструкцию ВАК можно передать контроль над 
выполнением программе отладки (часто называемой монитором в небольших ком- 
пьютерных системах), благодаря чему пользователь сможет отображать и менять 
содержимое регистров и ячеек памяти перед возобновлением выполнения. 


В следующем примере кода реализован минимальный обработчик, который разли- 
чает прерывания [ВО и инструкции вкк. В нем в качестве места временного хране- 
ния используется адрес памяти $14: 


; Обработка преры8аний /ТКО и инструкций ВЕК 
ТВО_ВВК_НАМОЕЕВ: 

; Сохранение содержимого регистра А 

$ТА $14 

; Издлечение флагов процессора из стека В регистр А 
РЕА 

РНА 

; Проверка установки бита В В слове флагов В стеке 
АМО $10 ; $10 выбирает бит В 
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; Если результат отличен от нуля, то бит В был установлен: 

; обработка для инструкции ВЕК 

ВМЕ ВВК_ТМ5ТА 

; бит В не был установлен: добавьте сюда обработку для прерывания /ТВО 

7 фо 

ЭМР ТВО БОМЕ 

ВВК_ТМ№ТА: 

; Добавьте сюда обработку для инструкции ВЕК 

5... 

ТВО ООМЕ: 

; Восстановление регистра А и Возврат 

ЕРА $14 

КТТ 
Этот пример показал, как различать прерывания, инициируемые со входа ВО 
процессора и инструкцией ВВК, в архитектуре процессора 6502. В более сложных 
процессорах, включая те, которые мы обсудим в последующих главах, для каждого 
входного сигнала, инициирующего прерывание, предусмотрены уникальные векто- 
ры прерываний (начальные адреса обработчиков прерываний). Эти архитектуры 
также содержат обширную поддержку функций отладки, таких как установка кон- 
трольных точек в местах расположения указанных инструкций. 


В предыдущих разделах были представлены категории инструкций в архитектуре 
процессора 6502 и дано краткое описание каждой инструкции в рамках этих кате- 
горий. Процессор 6502 намного проще, чем современные 32- и 64-разрядные про- 
цессоры, однако в этом обсуждении были представлены наиболее распространен- 
ные типы инструкций и режимов адресации, используемые даже в самых сложных 
современных процессорах, включая инструкции, поддерживающие универсальную 
концепцию обработки прерываний. 


В следующем разделе будут представлены основы обработки ввода-вывода, которая 
обеспечивает передачу данных между процессором и периферийными устройствами. 


Операции ввода-вывода 


Целью части архитектуры процессора, отвечающей за операции ввода-вывода, яв- 
ляется эффективная передача данных между внешними периферийными устройст- 
вами и памятью системы. Операции ввода переносят данные из внешнего мира в 
память, а операции вывода отправляют данные из памяти внешним адресатам. 


Формат данных на внешней стороне интерфейса ввода-вывода может быть самым 
разным. Вот несколько примеров внешнего представления данных ввода-вывода 
компьютера: 


» сигналы, передаваемые по видеокабелю, подсоединенному к монитору; 
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» колебания напряжения на проводах кабеля Еегпе"; 
® картина линий магнитного поля на поверхности диска; 
» звуковые волны, генерируемые динамиками компьютера. 


Независимо от того, какую форму данные принимают вне компьютера, соединение 
любого устройства ввода-вывода с процессором должно соответствовать архитек- 
туре ввода-вывода процессора, а устройство ввода-вывода должно быть совмести- 
мо с любыми другими устройствами ввода-вывода. которые присутствуют в ком- 
пьютерной системе. 


Для взаимодействия с устройствами ввода-вывода процессор использует категории 
инструкций, режимы адресации и методы обработки прерываний, описанные ранее 
в этой главе. Отличие заключается в том, что вместо чтения и записи данных в сис- 
темную память эти инструкции осуществляют считывание и запись данных в раз- 
делы памяти, которые используются для обмена данными с устройствами ввода- 
вывода. 


В современных процессорах для доступа к устройствам ввода-вывода применяются 
два основных подхода: ввод-вывод с распределением памяти и ввод-вывод с 
распределением по портам. При вводе-выводе с распределением памяти устрой- 
ствам ввода-вывода выделяются определенные части системного адресного про-. 
странства. Процессор обращается к периферийным устройствам по заранее опреде- 
ленным адресам с помощью тех же инструкций и режимов адресации, которые 
используются для чтения и записи в системную память. В процессоре 6502 для свя- 
зи с периферийными устройствами принят подход с распределением памяти. 


В процессорах, использующих ввод-вывод с распределением по портам, для вы- 
полнения операций ввода-вывода реализована отдельная категория инструкций. 
При этом для устройств ввода-вывода с распределением по портам выделяется ад- 
ресное пространство, не относящееся к системной памяти. В качестве адресов уст- 
ройствам ввода-вывода назначаются номера портов. В архитектуре х86 использу- 
ется ввод-вывод с распределением по портам. 


Одним из недостатков ввода-вывода с распределением памяти является необходи- 
мость выделения для устройств ввода-вывода части системного адресного про- 
странства, что ведет к уменьшению максимального объема памяти, который может 
быть установлен в компьютерной системе. Недостаток ввода-вывода с распределе- 
нием по портам — требование реализации в процессоре дополнительных инструк- 
ций для выполнения операций ввода-вывода. 


В некоторых реализациях ввода-вывода с распределением по портам предусматрива- 
ется предоставление дополнительных аппаратных сигналов, обозначающих обраще- 
ние к устройству ввода-вывода, а не к системной памяти. Представив этот сигнал в 
виде селектора (который фактически становится еще одним битом адреса), одни и те 
же адресные строки можно использовать для доступа и к памяти, и к устройствам 
ввода-вывода. В качестве альтернативного решения для выполнения операций ввода- 
вывода с распределением по портам в некоторых более высокопроизводительных 
процессорах реализуют полностью выделенную шину. Такая архитектура позволяет 
одновременно выполнять операции ввода-вывода и доступа к памяти. 
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В простейшем подходе к вводу-выводу процессор сам обрабатывает все этапы опе- 
рации ввода-вывода, используя инструкции для передачи данных между памятью и 
устройством ввода-вывода. В процессорах с более сложной архитектурой преду- 
смотрены аппаратные функции для ускорения повторяющихся операций ввода- 
вывода. Мы обсудим три метода выполнения операций ввода-вывода с разной сте- 
пенью использования процессора: программируемый ввод-вывод, ввод-вывод с 
управлением по прерываниям и прямой доступ к памяти. 


Программируемый ввод-вывод 


Программируемый ввод-вывод означает, что процессор выполняет каждый шаг 
операции передачи данных ввода-вывода с использованием программных инструк- 
ций. Рассмотрим клавиатуру, которая представлена процессору в виде двух ото- 
браженных в памяти однобайтовых адресов в адресной области ввода-вывода про- 
цессора. Один из этих байтов содержит информацию о состоянии, в частности бит, 
указывающий, когда была нажата клавиша. Второй байт содержит значение клави- 
ши, которая была нажата. 


При каждом нажатии клавиши устанавливается бит состояния "нажата клавиша". 
При использовании программируемого ввода-вывода процессор должен периоди- 
чески считывать регистр состояния клавиатуры, чтобы определить, была ли нажата 
клавиша. Если бит состояния указывает на нажатие клавиши, процессор считывает 
регистр данных клавиатуры, при этом бит состояния "нажата клавиша" обнуляет- 
ся до следующего нажатия клавиши. 


Если в регистре данных клавиатуры одновременно может храниться информация 
только об одной клавише, то операцию проверки состояния клавиатуры необходи- 
мо выполнять достаточно часто, чтобы ни одно нажатие клавиш не терялось, даже 
если за клавиатурой работает очень быстро печатающий пользователь. В результа- 
те процессор должен тратить значительное количество своего времени на проверку 
нажатий клавиш. При отсутствии быстрого ввода текста большинство из этих про- 
верок будут безрезультатными. 


Очевидно, что программируемый ввод-вывод не является высокоэффективным ме- 
тодом для решения задач общего назначения. По своей сути это похоже на провер- 
ку вашего телефона каждые несколько секунд, чтобы узнать, звонит ли вам кто- 
нибудь. 


Программируемый ввод-вывод имеет смысл в отдельных ситуациях. Например, 
одноразовая настройка периферийного устройства в ходе запуска системы является 
вполне разумным применением этого метода. 


Ввод-вывод с управлением по прерываниям 


Устройство ввода-вывода может использовать прерывания для уведомления про- 
цессора о необходимости выполнения действий. В случае простого интерфейса 
клавиатуры вместо установки бита в регистре состояния периферийное устройство 
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может устанавливать на линии ВО процессора 6502 низкий уровень для вызова 
прерывания при каждом нажатии клавиши. Такой подход позволяет освободить 
процессор от постоянных проверок нажатий клавиш, чтобы не отвлекать его от вы- 
полнения других операций. Процессор будет обращать внимание на интерфейс 
клавиатуры только тогда, когда необходимо выполнить работу, на что указывает 
прерывание. Использование прерываний для запуска операций ввода-вывода ана- 
логично добавлению звонка в телефон, который мы должны были проверять на на- 
личие входящих вызовов каждые несколько секунд при использовании программи- 
руемого ввода-вывода. 


В процессоре 6502 для операций ввода-вывода предусмотрен единственный маски- 
руемый входной сигнал вызова прерываний (ВО). Компьютерные системы 


обычно содержат несколько источников прерываний ввода-вывода. Это немного 
усложняет задачу обслуживания прерываний в 6502, поскольку процессор должен 
сначала определить, какое периферийное устройство инициировало прерывание, 
прежде чем он сможет начать передачу данных. 


Для того чтобы определить источник прерывания, обработчик прерываний должен 
опросить каждое устройство, поддерживающее такие прерывания. В случае интер- 
фейса клавиатуры эта операция опроса состоит из считывания регистра состояния 
клавиатуры, чтобы определить, установлен ли бит, указывающий на то, что про- 
изошло нажатие клавиши. Как только процессор идентифицирует устройство, от- 
ветственное за прерывание, он переходит к коду, который взаимодействует с уст- 
ройством, для выполнения запрошенной задачи ввода-вывода. В случае интерфейса 
клавиатуры код обработки выполняет чтение регистра данных клавиатуры и очист- 
ку бита состояния, указывающего на нажатие клавиши, в результате чего входной 


сигнал КО отключается. 


Прерывания от внешних устройств являются асинхронными событиями — это о03- 
начает, что они могут произойти в любой момент времени. Проектирование ком- 
пьютерной системы требует тщательного анализа даже самых маловероятных воз- 
можностей формирования прерываний, например во время запуска системы или 
при обработке других прерываний. Прерывания от нескольких устройств могут по- 
ступать одновременно или почти одновременно и в случайном порядке. Аппарат- 
ные схемы обработки прерываний и код обслуживания прерываний должны обес- 
печивать обнаружение и обработку всех прерываний независимо от их временных 
характеристик. 


Управление вводом-выводом на основе прерываний избавляет процессор от необ- 
ходимости периодически проверять устройства ввода-вывода, чтобы определить, 
требуется ли выполнение какого-либо действия. Однако обработка прерывания 
может занять значительное время процессора, если оно связано с передачей боль- 
шого блока данных. Подобная ситуация часто возникает во время таких операций, 
как чтение с диска или запись на него. Следующий метод ввода-вывода, который 
мы обсудим, устраняет потребность в привлечении процессора к работе по переда- 
че таких больших блоков данных. 
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Прямой доступ к памяти 


Прямой доступ к памяти (дтесЕ тетогу ассезз, ОМА) позволяет периферийным 
устройствам получать доступ к системной памяти независимо от процессора. При 
использовании ОМА для передачи блока данных процессор настраивает эту опера- 
цию, передавая в контроллер ОМА начальный адрес перемещаемого блока данных, 
длину блока и адрес места назначения. После запуска процедуры ОМА процессор 
может продолжить работу по. выполнению других операций. После завершения 
операции контроллер ОМА генерирует прерывание, чтобы сообщить процессору о 
том, что передача данных завершена. 


В компьютерной системе контроллер ОМА можно реализовать в виде отдельной 
интегральной схемы, управляемой процессором, либо архитектура процессора мо- 
жет содержать один или несколько встроенных ОМА-контроллеров. 


Устройства ввода-вывода, которые перемещают значительные объемы данных, та- 
кие как дисковые накопители, звуковые карты, видеокарты и сетевые интерфейсы, 
обычно используют ОМА для эффективной передачи данных в системную память и 
из нее. Технология ОМА также используется для передачи блоков данных в сис- 
темной памяти. 


Архитектура процессора 6502 не поддерживает операции ОМА, но оригинальный 
]ВМ РС включал в себя ОМА-контроллер. Архитектура почти каждого 32- или 
64-разрядного процессора обеспечивает обширную поддержку операций ОМА. 


ОМА — один из многих методов, которые повышают производительность компью- 
терной системы за счет ускорения повторяющихся операций. В главах 5 и 9мы рас- 
смотрим несколько примеров использования ОМА для ускорения операций ввода- 
вывода. 


Резюме 


В этой главе были описаны основные функциональные блоки простого процессора: 
блок управления, арифметико-логическое устройство и регистры. За описаниями 
этих компонентов последовал обзор инструкций и режимов адресации процессора. 
С целью демонстрации разнообразия и полезности инструкций, доступных в отно- 
сительно простой процессорной архитектуре, были рассмотрены категории инст- 
рукций, реализованные в процессоре 6502. 


Также в контексте архитектуры процессора 6502 были представлены и продемон- 
стрированы концепции, связанные с обработкой прерываний. Глава завершилась 
обзором наиболее распространенных архитектурных подходов к управлению опе- 
рациями ввода-вывода (ввод-вывод с распределением памяти и ввод-вывод с рас- 
пределением по портам) и основных режимов выполнения операций ввода-вывода 
в компьютерной системе (программируемый ввод-вывод, ввод-вывод на основе 
прерываний и прямой доступ к памяти). 


После завершения этой главы вы должны иметь общее представление о функцио- 
нальных блоках процессора, обработке инструкций и прерываний, а также об опе- 
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рациях ввода-вывода. Эта информация является основой для следующей главы, 
в которой рассматривается архитектура на уровне компьютерной системы. 


Упражнения 


1. 


Рассмотрим сложение двух 8-битных чисел со знаком (т. е. чисел в диапазоне 
от —128 до +127), где один операнд положительный, а другой — отрицатель- 
ный. Существует ли какая-либо пара 8-битных чисел с разными знаками, сумма 
которых выходит за пределы диапазона от —128 до +127? Такая ситуация будет 
представлять собой знаковое переполнение. Примечание: мы рассматриваем 
здесь только сложение, потому что, как мы видели, вычитание в архитектуре 
процессора 6502 — это то же самое, что и сложение, но с инверсией битов пра- 
вого операнда. 


Если ответ на упражнение [| — "нет", это означает, что единственный способ 
создать знаковое переполнение — сложить два числа с одинаковыми знаками. 
Если происходит переполнение, что вы можете сказать о результате выполне- 
ния операции "исключающее ИЛИ" между старшим битом каждого операнда и 
старшим битом результата? Другими словами, каков будет результат выраже- 
ний 1е+Е(7) ХОВ гези1*(7) и г1вНЕ(7) ХОВ гези1*(7)? В этих выражениях (7) указы- 
вает на бит 7 — старший бит. 


Посмотрите на листинг УНПЕ, в разд. "Арифметико-логическое устройство" в 
этой главе и определите, является ли логика установки и обнуления флага У 
корректной для операций сложения и вычитания. Проверьте результаты сложе- 
ния 126 + 1, 127+1,-127 + (-Пи-128 + (-1). При пересылке данных через сре- 
ду передачи, подверженную ошибкам, чтобы определить, были ли какие-либо 
биты данных потеряны или искажены во время передачи, обычно используется 
контрольная сумма. Она, как правило, добавляется к переданной записи дан- 
ных. В одном из алгоритмов расчета контрольной суммы используются сле- 
дующие шаги: 


1) сложение всех байтов в записи данных с сохранением только младших 8 бит 
суммы; 


2) определение контрольной суммы, которая представляет собой дополнение 
до двух этой 8-битной суммы; 


3) добавление байта контрольной суммы к записи данных. 


После получения блока данных с добавленной контрольной суммой процессор 
может определить правильность контрольной суммы простым сложением всех 
байтов в записи, включая контрольную сумму. Контрольная сумма является 
правильной, если младшие 8 бит суммы равны нулю. Реализуйте этот алгоритм 
контрольной суммы, используя язык ассемблера 6502. Байты данных начина- 
ются с ячейки памяти по адресам $16-$11, а количество байтов (включая байт 
контрольной суммы) предоставляется в качестве входных данных в регистре Х. 
Установите для регистра А значение 1, если контрольная сумма является пра- 
вильной, и значение 0 в ином случае. 
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4. Поместите код проверки контрольной суммы из упражнения 4 в помеченную 
подпрограмму, которую можно вызвать с помощью инструкции 358 и которая 
завершается инструкцией ВТ<. 


5. Напишите и выполните набор тестов для проверки правильности работы под- 
программы проверки контрольной суммы, которую вы создали в упражнени- 
ях 4-5. Какова длина самого короткого блока данных, для которого ваш код 
может выполнить проверку контрольной суммы? Какова длина самого длинно- 
го блока данных? 


Компоненты компьютерной системы 


В этой главе представлены более низкоуровневые компоненты, используемые при 
построении компьютерных систем. Мы начнем с транзистора на основе структуры 
металл-оксид-полупроводник (МОП), который нашел широкое применение в схе- 
мах памяти, а также практически во всех других современных цифровых устройствах. 
Мы рассмотрим устройство компьютерной памяти на основе МОП-транзисторов и 
ее интерфейс с процессором. Мы познакомимся с современными компьютерными 
интерфейсами ввода-вывода, уделяя особое внимание высокоскоростной последо- 
вательной связи внутри компьютера, а также передаче данных через кабельные со- 
единения внешним компонентам. Будут рассмотрены функциональные требования 
к устройствам системного ввода-вывода, включая дисплей, сетевой интерфейс, кла- 
виатуру и мышь. Глава заканчивается наглядным примером технических характе- 
ристик материнской платы современного компьютера. 


После прочтения этой главы вы получите четкое представление об аппаратных 
компонентах современных компьютерных систем — от их технических характери- 
стик до схемного уровня. Вы будете знать, как реализована системная память, 
включая основы кеширования. Понимать механизмы эффективных операций ввода- 
вывода и использования интерфейса Ощуегза! Зета! Виз (0ЗВ) для подключения 
клавиатуры, мыши и других устройств ввода-вывода. Вы получите представление о 
сетевом интерфейсе и познакомитесь с основными техническими характеристиками 
материнской платы современного компьютера. 


В этой главе будут рассмотрены следующие темы: 
» подсистема памяти; 
» знакомство с полевыми МОП-транзисторами; 


» построение схем динамической памяти с помощью полевых МОП-транзис- 
торов; 


е подсистема ввода-вывода, 
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» графические дисплеи; 
» сетевой интерфейс; 
» клавиатура и мышь; 


® технические характеристики современных компьютерных систем. 


Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 
66 рз://2 ВиЬ.сот/РаскРи 5 тр/Модегп-Сотрщег-АгсВКесиге-апд- 
ОграпаНопт-Зесопд-ЕЧ! оп. 


Подсистема памяти 


Подсистема памяти — это адресуемая последовательность ячеек памяти, содер- 
жащих инструкции и данные для использования процессором при выполнении про- 
грамм. Современные компьютерные системы и цифровые устройства часто содер- 
жат более миллиарда 8-битных ячеек в основной памяти, каждая из которых может 
быть независимо считана и записана процессором. 


Как было показано в главе [, конструкция аналитической машины Бэббиджа в ка- 
честве средства хранения данных для вычислений включала в себя набор осей, на 
каждой из которых были установлены 40 колес, отражающих десятичные разряды. 
Считывание данных с оси было разрушительной операцией, приводящей к обнуле- 
нию цифр на каждом из колес оси после завершения считывания. Это был полно- 
стью механический метод хранения данных. 


С 1950-х по 1970-е годы предпочтительной технологией реализации цифровой 
компьютерной памяти был магнитный сердечник. Один бит памяти на магнитных 
сердечниках хранится в небольшом тороидальном (в форме пончика) керамическом 
постоянном магните. Сердечники набора, составляющего массив памяти, располо- 
жены в узлах прямоугольной сетки, образуемой горизонтальными и вертикальными 
соединительными проводами. Запись в битовую ячейку заключается в подаче по 
проводам, проходящим через сердечник, достаточного тока, чтобы можно было 
изменить полярность его магнитного поля. Бит 0 может быть определен как цирку- 
ляция магнитного потока внутри сердечника по часовой стрелке, а бит | — как 
циркуляция потока против часовой стрелки. 


Считывание бита из памяти на магнитных сердечниках заключается в попытке ус- 
тановить для бита полярность 0 и наблюдении за электрическим откликом. Если 
выбранный сердечник уже содержит бит 0, то отклика не будет. Если сердечник 
содержит 1, то при изменении полярности возникает заметный импульс напряже- 
ния. Как и в аналитической машине Бэббиджа, операция чтения из памяти на маг- 
нитных сердечниках является разрушительной. После считывания битового значе- 
ния 1 из памяти необходимо выполнить последующую запись, чтобы восстановить 
состояние бита. 
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Память на магнитных сердечниках является энергонезависимой: после отключения 
питания ее содержимое сохраняется в течение неопределенного срока. Она также 
обладает свойствами, которые делают ее ценной в таких областях применения, как 
космические аппараты, где важна устойчивость к радиации. Известно, что компью- 
теры космических кораблей системы "Спейс Шаттл" использовали память на маг- 
нитных сердечниках до конца 1980-х годов. 


В современных компьютерных системах потребительского и бизнес-класса для ос- 
новной системной памяти почти исключительно используются схемы динамиче- 
ской памяти произвольного доступа (4упатис гапдот ассез$ тетогу, ОВАМ) на 
основе полевых МОП-транзисторов (те{а-ох14де-зеписопдисюг Не!4-еЁЕес( шапз1$ юг, 
МОЗЕЕТ). В следующем разделе представлены особенности полевых МОП- 
транзисторов. 


Знакомство с полевыми МОП-транзисторами 


В главе 2 описан п-р-п-транзистор, относящийся к типу биполярных транзисторов 
(Ыро]аг лапсНоп 1гапз1$ юг, ВУГ). Транзистор типа и-р-п называется биполярным, т. к. 
для его функционирования используются как положительные (р), так и отрица- 
тельные (п) носители заряда. 


В полупроводниках носителями отрицательного заряда служат электроны. В работе 
полупроводника не участвуют физические частицы с положительным зарядом. 
Вместо этого при отсутствии обычно присутствующего электрона атом проявляет 
те же свойства, что и положительно заряженная частица. Эти недостающие элек- 
троны называются дырками. В биполярных транзисторах дырки выполняют функ- 
ции носителей положительного заряда. 


Концепция дырок настолько фундаментальна для работы полупроводников, что 
Уильям Шокли (\МШат ЗвосКеу), один из изобретателей транзистора, написал 
книгу под названием "Электроны и дырки в полупроводниках" ("Еесгоп$ ап Но[ез 
ш Зеписопдисв®югз"), которая была опубликована в 1950 г. Далее мы рассмотрим по- 
ведение положительных и отрицательных носителей заряда в униполярных транзи- 
сторах. 


В отличие от биполярных транзисторов, униполярный транзистор полагается 
только на один из двух типов носителей заряда. Полевой транзистор на основе 
структуры металл-оксид-полупроводник (полевой МОП-транзистор — тез|- 
ох14е-зеписопдисюг Не!4-еНес{ гапз1$юг, МОЗЕЕТ) — это униполярный транзистор, 
пригодный для использования в качестве цифрового переключающего элемента. 
Как и транзистор типа и-р-п, полевой МОП-транзистор представляет собой трехпо- 
люсное устройство с управляющим входом для включения и выключения тока, 
протекающего через два других вывода. Выводы полевого МОП-транзистора назы- 
вают затвором, стоком и истоком. Вывод затвора управляет протеканием тока 
между выводами стока и истока. 


Полевые МОП-транзисторы относятся к категории устройств, работающих в ре- 
жиме обогащения носителями или в режиме обеднения носителями. МОП- 
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транзистор в режиме обогащения носителями блокирует протекание тока между 
стоком и истоком, когда напряжение на затворе равно нулю, и разрешает протека- 
ние тока, когда напряжение на затворе превышает пороговое напряжение. МОП- 
транзистор в режиме обеднения носителями функционирует противоположным об- 
разом, блокируя протекание тока при высоком напряжении на затворе и разрешая 
его протекание, когда напряжение на затворе равно нулю. 


На рис. 4.1 показано схематическое представление и-канального МОП-транзистора 
в режиме обогащения носителями. 


Сток 


Затвор 


Исток 
Рис. 4.1. п-Канальный МОП-транзистор в режиме обогащения носителями 


Для наших целей и-канальный МОП-транзистор в режиме обогащения носителями 
функционирует как переключатель: когда напряжение на затворе относительно ис- 
тока низкое (ниже порогового напряжения), между стоком и истоком возникает 
очень высокое сопротивление. Когда напряжение на затворе относительно истока 
высокое (выше порогового напряжения), сопротивление между этими выводами 
очень мало. Буква и в обозначении "я-канальный" связана с каналом в кремнии, 
который был легирован для увеличения числа электронов (носителей отрицатель- 


ного заряда). 


Поведение полевого МОП-транзистора напоминает работу и-р-п-транзистора, рас- 
смотренного в главе 2. Однако есть важное отличие: МОП-транзистор — это уст- 
ройство, управляемое напряжением, в то время как и-р-п-транзистор управляется 
током. При использовании и-р-п-транзистора в качестве переключателя, чтобы ток 
протекал между его эмиттером и коллектором, через базу должен протекать не- 
большой, но постоянный ток. В случае же МОП-транзистора для протекания тока 
между стоком и истоком требуется лишь приложить между затвором и истоком на- 
пряжение, величина которого выше порогового значения. Для удержания такого 
переключателя в открытом состоянии протекания тока через вход затвора практи- 
чески не требуется. Благодаря этому МОП-транзистор потребляет значительно 
меньше энергии, чем п-р-и-транзистор, выполняющий эквивалентную цифровую 
функцию. 


Мохаммед Аталла (Мовате4 А1аПа) и Давон Канг (Оамоп КавпР) из Ве Т@аервопе 
ГаБогаюопез изобрели МОП-транзистор в 1959 г. И только в начале 1970-х годов 
производственные процессы стали достаточно развитыми, чтобы обеспечить на- 
дежное изготовление интегральных схем на основе МОП-структуры. С тех пор 
МОП-транзистор является наиболее распространенным типом транзисторов, ис- 
пользуемых в интегральных схемах. Согласно оценкам, в 2018 г. было изготовлено 
13 секстиллионов транзисторов (секстиллион — это число, представляемое едини- 
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цей с 21 нулем), 99,9% из которых были МОП-транзисторами. МОП-транзистор 
является наиболее часто производимым устройством в истории человечества. 


р-канальный МОП-транзистор в режиме обогащения носителями похож на п-каналь- 
ный МОП-транзистор в режиме обогащения носителями, за исключением того, что 
он демонстрирует противоположную реакцию на напряжение между затвором и 
истоком: если напряжение на выводе затвора ниже, чем на выводе истока, и разни- 
ца между ними превышает пороговое напряжение, то ток протекает между стоком 
и истоком, а если напряжение между затвором и истоком меньше этого порогового 
значения, то протекание тока между стоком и истоком блокируется. Буква р в обо- 
значении "р-канальный" указывает на легирование канала, которое увеличивает 
количество дырок (носителей положительного заряда). На рис. 4.2 показано схема- 
тическое представление р-канального МОП-транзистора в режиме обогащения но- 


сителями. 


Исток 
Затвор 


Сток 
Рис. 4.2. р-Канальный МОП-транзистор в режиме обогащения носителями 


Для того чтобы различать схематические представления и- и р-канальных МОП- 
транзисторов, обратите внимание, что в обеих конфигурациях вывод истока под- 
соединен к центральному из трех внутренних соединений. В и-канальном МОП- 
транзисторе стрелка на этом соединении указывает на затвор, а в р-канальном 
МОП-транзисторе — в направлении от затвора. 


Как п-канальные, так и р-канальные МОП-транзисторы в режиме обогащения носи- 
телями можно считать нормально разомкнутыми переключателями. Это означает, 
что они не проводят ток, когда напряжение между затвором и истоком мало. Как я- 
канальные, так и р-канальные МОП-транзисторы также доступны в конфигурации, 
обеспечивающей работу в режиме обеднения носителями, что позволяет им функ- 
ционировать как нормально замкнутые переключатели. Ток протекает через МОП- 
транзисторы, работающие в режиме обеднения носителями, когда напряжение ме- 
жду затвором и истоком мало, но не когда оно велико. 


Для выполнения логических функций п- и р-канальный МОП-транзисторы часто 
используют в паре. Устройство, включающее в себя такую пару МОП- 
транзисторов, называется интегральной схемой на основе комплементарной 
МОП-структуры (КМОП-схемой). Название КМОП отражает тот факт, что тран- 
зисторы в каждой паре функционируют противоположным или взаимодополняю- 
щим образом. Вне периодов переключения КМОП-схемы почти не потребляют 
энергии, поскольку входы затворов не требуют практически никакого тока. Струк- 
туру КМОП-схемы разработали Чи-Тан Сах (СЬШ-ТапР За) и Фрэнк Ванласс 
(Егапк \/ап!а5$) из компании ЕаисрПА Зеписопдисюг в 1963 г. 
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На рис. 4.3 показана схема вентиля НЕ, в которой п-р-п-транзистор из главы 2 был 
заменен парой комплементарных полевых МОП-транзисторов. 


р-канальный 
МОП-транзистор 


Выход 
5В ——— (0-5 В) 


п-канальный 
МОП-транзистор 


ОВ 


Рис. 4.3. КМОП-схема вентиля НЕ 


Когда сигнал Вход имеет низкий уровень (вблизи 0 В), нижний и-канальный МОП- 
транзистор выключается, а верхний р-канальный МОП-транзистор включается. 
В результате Выход подключается к положительному полюсу источника напряже- 
ния, что вызывает увеличение уровня сигнала Выход примерно до 5 В. Когда сиг- 
нал Вход имеет высокий уровень, верхний МОП-транзистор выключен, а нижний 
МОП-транзистор включен, что вызывает снижение сигнала Выход почти до 0 В. 
Сигнал Выход всегда является инвертированным по отношению к сигналу Вход, 
что соответствует поведению вентиля НЕ. 


Сегодня практически все цифровые интегральные схемы высокой плотности осно- 
ваны на технологии КМОП. Помимо выполнения логических функций, полевой 
МОП-транзистор является ключевым компонентом современной архитектуры схем 
оперативной памяти (гапдот ассез$ тетогу, КАМ). В следующем разделе обсуж- 
дается использование полевых МОП-транзисторов в схемах памяти. 


Построение схем динамической памяти 
с помощью полевых МОПл-ранзисторов 
Один бит в стандартной интегральной схеме динамической памяти произвольно- 
го доступа (ОВАМ) состоит из двух схемных элементов: МОП-транзистора и кон- 


денсатора. В следующем разделе представлено краткое введение в электрические 
характеристики конденсаторов. 


Конденсатор 


Конденсатор — это пассивный схемный элемент с двумя выводами, способный 
накапливать энергию. Энергия поступает в конденсатор и покидает его в виде элек- 
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трического тока. Напряжение на выводах конденсатора пропорционально количе- 
ству содержащейся в нем электрической энергии. 


Продолжая аналогию с гидравлической системой, описанной в главе 2, представьте, 
что конденсатор — это воздушный шарик, подсоединенный к боковой стороне тру- 
бы, ведущей к водопроводному крану. Давление воды в трубе заставляет шарик 
надуваться, наполняя его водой из трубы. Предположим, что это прочный воздуш- 
ный шарик, и при надувании он растягивается, увеличивая внутреннее давление. 
Шарик наполняется до тех пор, пока давление в нем не сравняется с давлением в 
трубе, после чего перестает наполняться. 


Если полностью открыть кран на конце трубы, то в результате выпуска воды дав- 
ление в трубе уменьшится. Вода из шарика будет вытекать обратно в трубу до тех 
пор, пока давление в шарике снова не сравняется с давлением в трубе. 


Гидравлические устройства, называемые амортизаторами гидравлических уда- 
ров, функционируют именно таким образом, решая проблему труб, которые издают 
стучащие звуки при открывании и закрывании водопроводных кранов. Амортиза- 
тор гидравлических ударов демонстрирует поведение, подобное растяжению воз- 
душного шарика, сглаживая резкие изменения давления воды, возникающие при 
открывании и закрывании кранов. 


Количество электрической энергии, содержащейся в конденсаторе, аналогично ко- 
личеству воды в воздушном шарике. Напряжение на конденсаторе аналогично дав- 
лению внутри воздушного шарика, возникающему при его растяжении. 


Электрический конденсатор можно изготовить из двух параллельных металличе- 
ских пластин, разделенных изолирующим материалом, например воздухом. Выво- 
ды конденсатора подсоединены к каждой из пластин. Отношение количества запа- 
сенной электрической энергии к напряжению на конденсаторе называется 
емкостью. Она зависит от размера параллельных пластин, расстояния между ними 
и типа материала, используемого в качестве изолятора. Емкость конденсатора ана- 
логична размеру воздушного шарика в примере с гидравлической системой. Кон- 
денсатор с большей емкостью соответствует шарику большего размера. Для напол- 
нения большого воздушного шарика до заданного давления требуется больше 
воды, чем для наполнения маленького. 


Схематическое обозначение конденсатора показано на рис. 4.4. 


1 
Т 


Рис. 4.4. Схематическое обозначение конденсатора 


Две горизонтальные линии с зазором между ними отражают конструкцию конден- 
сатора с металлическими пластинами, описанную в этом разделе. Единицей изме- 
рения емкости является фарад, названный в честь английского ученого Майкла 
Фарадея, который, помимо многих других своих достижений, изобрел электродви- 
гатель. 
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Битовая ячейка динамической памяти 


Битовая ячейка динамической памяти (4упапис гапдот ассез$ тетогу, ОКАМ) — 
это доступное для чтения и записи место хранения одного бита данных. Модуль 
памяти ОКАМ в современном компьютере или телефоне содержит миллиарды би- 
товых ячеек. Один бит в схеме ОКАМ состоит из МОП-транзистора и конденсато- 
ра, расположенных так, как показано на рис. 4.5. 


Шина слов 


Шина битов 


Рис. 4.5. Схема битовой ячейки БКАМ 


На этом рисунке символ с тремя горизонтальными линиями в правом нижнем углу 
является символом земли — стандартного представления опорного напряжения 
ОВ, которое мы использовали в предыдущих схемах, таких как показанная на 
рис. 4.3. Шина слов и шина битов — это провода, используемые для соединения 
отдельных битовых ячеек в сетку. 


Эта однобитовая ячейка повторяется в прямоугольной сетке, образуя полный банк 
памяти РКАМ. На рис. 4.6 показана конфигурация 16-битного банка памяти 
ОКАМ, состоящего из 4 слов по 4 бита каждое. 


Реальные банки памяти ОКАМ содержат гораздо большее количество битов, чем 
показанная здесь простая схема. Типичные устройства ОВАМ имеют размер слова 
8 бит, ане 4 бита, обозначенные на этом рисунке как Ви—Вз. Это означает, что схема 
ОКАМ позволяет параллельно сохранять или извлекать 8 бит. 


Количество экземпляров битовых ячеек на шине слов в реальном массиве банков 
ОКАМ является целым числом, кратным размеру слова устройства. Большие модули 
РКАМ, используемые в персональных компьютерах, содержат много слов на каж- 
дой шине слов. Например, микросхема ОКАМ с 8-битовыми словами и 1024 слова- 
ми в строке содержит 8192 бита в строке, при этом все выводы затворов МОП- 
транзисторов вдоль строки управляются одним сигналом по шине слов. Эти уст- 
ройства содержат дополнительную логику мультиплексора для выбора конкретного 
запрашиваемого процессором слова из множества слов в ряду, выбранном активной 
шиной Слов. 


Вертикальное измерение банка памяти ОКАМ состоит из реплицированных копий 
рядов ячеек с одной шиной слов, управляющей каждым рядом. Шина слов соеди- 
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няет все битовые ячейки по горизонтали, а сигналы ШИНЫ битов -—— ячейки во всех 
строках по вертикали. 


Во В: В: Вз 


1 1 и 


Рис. 4.6. Организация банка памяти ЭКАМ 


Е 


Состояние каждого бита памяти хранится в конденсаторе ячейки. Низкое напряже- 
ние на конденсаторе отражает значение 0, а высокое напряжение — значение 1. 
В контексте устройств памяти РКАМ ООК5 низкое напряжение — около 0 В, а вы- 
сокое — около 1,1 В. 


На шине слов для каждого ряда большую часть времени поддерживается низкое 
напряжение. Это обеспечивает нахождение МОП-транзисторов в выключенном со- 
стоянии, при котором сохраняется состояние конденсатора. Когда приходит время 
прочитать слово (фактически — целый ряд) из устройства ОКАМ, схема адресации 
выбирает соответствующую шину слов и подает на нее напряжение высокого уров- 
ня, а на всех остальных шинах слов в банке сохраняется низкое напряжение. При 
этом МОП-транзисторы в каждой битовой ячейке на активной шине слов открыва- 
ются, подавая напряжение конденсаторов этих ячеек на подключенные шины би- 
тов. Шины битов для ячеек в состоянии 1 (высокий уровень) будут иметь более вы- 
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сокое напряжение, чем шины для ячеек в состоянии 0 (низкий уровень). Напряже- 
ния на шинах битов считываются схемой устройства ОКАМ и фиксируются в вы- 
ходном регистре микросхемы. 


Запись в слово ОКАМ начинается с установки высокого уровня на выбранной шине 
слов таким же образом, как и при чтении слова. Вместо измерения напряжений на 
шинах битов устройство ОКАМ подает на каждую битовую линию напряжение, 
которое должно быть записано в каждую ячейку — 0 или 1,1 В, в зависимости от 
того, какое значение должен получить бит данных — 0 или |. Как и при наполне- 
нии или опорожнении воздушного шарика, каждому конденсатору требуется неко- 
торое время, чтобы зарядиться или разрядиться до напряжения, действующего на 
шине битов, к которой он подсоединен. По истечении этой задержки на шину слов 
подается низкий уровень, чтобы закрыть МОП-транзисторы и зафиксировать новые 
уровни заряда конденсаторов. 


Технология схем ОКАМ осложняется тем фактом, что конденсаторам свойственна 
утечка. После зарядки конденсатора до ненулевого напряжения заряд со временем 
утекает, уменьшая напряжение на конденсаторе. Из-за этого содержимое каждой 
ячейки необходимо периодически обновлять. 


Операция обновления считывает значение каждой ячейки и затем записывает его 
обратно в ячейку. При этом конденсатор перезаряжается до "полного" уровня на- 
пряжения, если он представляет значение 1, или разряжается почти до 0 В, если он 
представляет значение 0. Типичный интервал обновления для современных уст- 
ройств ОКАМ составляет 64 миллисекунды. Обновление ОВАМ происходит не- 
прерывно, строка за строкой, в фоновом режиме во время работы системы и син- 
хронизируется с доступом процессора к памяти, чтобы избежать конфликтов. 
В ходе этого процесса наблюдается небольшое снижение производительности, ко- 
торое возникает, когда доступ процессора к памяти задерживается из-за выполне- 
ния обновления. 


Необходимость периодического обновления значительно усложняет конструкцию 
систем, использующих устройства памяти ОКАМ, однако преимущества хранения 
состояния бита с помощью всего лишь одного транзистора и одного конденсатора 
настолько велики, что ОКАМ вытеснила все альтернативы в качестве предпочти- 
тельной технологии ДлЯ основной памяти в компьютерных системах потребитель- 
ского, коммерческого и научного назначения. 


В следующем разделе будет рассмотрена архитектура текущего поколения техно- 
логии ОКАМ — ООБ5. 


ЗОВАМ 0085 


Компания 1\{е| выпустила первую коммерческую интегральную схему ОКАМ в 
1970 г. пе 1103 содержала 1024 бита и имела размер слова 1 бит. Обновление в 
[ие! 1103 необходимо было выполнять каждые 2 миллисекунды. В начале 1970-х 
годов память ОКАМ на МОП-устройствах опередила память на магнитных сердеч- 
никах в качестве предпочтительной технологии памяти в компьютерных системах. 
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ОКАМ является энергозависимой технологией, т. е. при отключении питания заряд 
в конденсаторах битовых ячеек утекает, и данные теряются. 


Термин "удвоенная скорость передачи данных" (доц Ме даа г\е, РОВ) относит- 
ся к временным характеристикам обмена данными между модулем памяти и кон- 
троллером памяти процессора. Исходная технология ОКАМ с базовой скоростью 
передачи данных (тре даа ге, ЗОВ.) предусматривала выполнение одной опе- 
рации передачи данных за цикл тактового сигнала памяти. Устройства памяти РОК 
выполняют две операции передачи за цикл тактового сигнала: одну — по фронту 
тактового сигнала, и вторую — по его спаду. Цифра после "ООВ" обозначает поко- 
ление технологии ООК. Таким образом, ООВ5 — это пятое поколение стандарта 
РОК. Термин "синхронная ОКАМ" (5упсЬгопоиз$ ОВАМ, 5ОКАМ) указывает на 
то, что схема ОКАМ синхронизирована с контроллером памяти процессора с по- 
мощью общего тактового сигнала. Текущим поколением технологии ОКАМ, широ- 
ко используемой в настоящее время, является ЗОКАМ РОК4, а БОКАМ ООК5 
только начинает выходить на рынок. 


Современные персональные компьютеры и мобильные устройства, такие как 
смартфоны, как правило, содержат несколько гигабайтов (Гбайт) оперативной па- 
мяти. 1 Гбайт содержит 22° байт, что эквивалентно 1 073 741 824 (чуть более одного 
миллиарда) байтам. Как следует из названия, память произвольного доступа позво- 
ляет процессору за одну операцию считывать или записывать любую ячейку памя- 
ти в адресном пространстве оперативной памяти. По состоянию на 2021 г. высоко- 
классный модуль памяти для использования в ноутбуках содержит 32 Гбайт памяти 
ОКАМ, распределенной между 16 интегральными схемами. Каждая схема ОКАМ в 
этом модуле содержит 2 гигаслова (1 гигаслово — это 2% слов) при длине одного 
слова 8 бит. 


В 202] г. ведущим стандартом модулей памяти должен был стать ЗОКАМ ООВ5 — 
усовершенствованная и оптимизированная технология РКАМ, основанная на поко- 
лениях ООВ1, ООК2, ООКЗ и ООЕВ4. Модуль памяти ООК5 помещен в корпус типа 
ОТММ (49а! шПле тетогу тоде — модуль памяти с двухрядным расположе- 
нием выводов). Для подсоединения к разъему ОММ на материнской плате модуль 
ОММ оснащен электрическими контактами по обе стороны печатной платы (от- 
сюда термин "Овухрядный" в его названии). Стандартный разъем ОИММ ООК5 име- 
ет 288 контактов. Для таких систем, как ноутбуки, где свободное пространство 
ограничено, предусмотрен более компактный формат, называемый ЗОПИММ (та 
оиЙште ОММ). Стандартный разъем ЗООГММ ООК$5 имеет 262 контакта. Из-за 
уменьшенного количества контактов модули ЗООММ лишены функций, которые 
поддерживают некоторые модули РММ, например способности обнаруживать и 
исправлять битовые ошибки в данных, извлекаемых из устройства. Эту способность 
обеспечивает применение кода коррекции ошибок (егтог сотесйп? соде, ЕСС). 


Модули памяти ОРВ5 обычно рассчитаны на напряжение питания 1,1 В. Показа- 
тельный пример — отдельный модуль ООК5 может выполнять до 4,8 млрд опера- 
ций передачи данных в секунду, что вдвое превышает тактовую частоту памяти 
2400 МГц. При скорости передачи 8 байт/с это устройство ООЕ5 теоретически мо- 
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жет передавать в секунду 38,4 Гбайт данных. Модули ООВ5 будут доступны с раз- 
личными тактовыми частотами, объемами памяти и по разным ценам. 


В реальных модулях ОКАМ используются прямоугольные банки однобитных яче- 
ек, которые были описаны в предыдущем разделе, однако внутренняя архитектура 
устройств РОВ5 несколько сложнее. Интегральная схема ОКАМ обычно содержит 
несколько банков. Перед выполнением операции чтения или записи логика адреса- 
ции выбирает банк, содержащий нужную ячейку памяти. В модулях ООК5 банки 
дополнительно организованы в группы банков, что требует дополнительной логи- 
ки адресации для выбора нужной группы. Устройство ООК5 содержит до 8 групп 
банков, каждая из которых содержит до 4 банков. Причина разделения архитектуры 
модуля ООВ5 на несколько групп банков заключается в том, чтобы довести ско- 
рость передачи данных до максимума за счет параллельного выполнения несколь- 
ких одновременных операций доступа к памяти с перекрытием. Это позволяет пе- 
редавать данные между процессором и оперативной памятью с максимальной 
скоростью, сводя к минимуму потребность в ожидании завершения каждой опера- 
ции доступа к ОКАМ. 


Помимо указания правильного адреса в модуле памяти ООК5 система должна пе- 
редать посредством интерфейсных сигналов команду, указывающую действие, ко- 
торое должно быть выполнено: чтение из памяти, запись в память или обновление 
состояния выбранной строки. 


В стандарте РОК5 5ОКАМ, который можно приобрести в Объединенном совете 
по проектированию электронных устройств (ош! Емескоп Оеу1се Епртеетпе 
Соцпс!, ЕРЕС) по адресу В@рз://мумууу.4едес.ог?/${апдаг5-доситет65/40с$/]е$479-5, 
приведено подробное определение интерфейса памяти ООВ5 для компьютерных 
систем. Этот стандарт содержит всю информацию, необходимую для разработки 
модулей памяти, совместимых с любой компьютерной системой, поддерживающей 
ООВ$5. 


Исторически сложилось так, что каждое новое поколение стандартов ОРВ ЗОКАМ 
было несовместимо с предыдущими поколениями. Материнская плата, созданная 
для модулей памяти ООКВ5, будет работать только с модулями ООВ5. Разъем для 
каждого поколения модулей ООК устроен таким образом, что вставить в него мо- 
дуль другого поколения невозможно. Например, модуль ОКАМ ООВА4 несовместим 
с разъемом ООВ5. 


По мере развития технологий памяти основными улучшениями в каждом новом 
поколении являются увеличение скорости передачи данных и повышение плотно- 
сти памяти. Для достижения этих целей в более поздних поколениях было умень- 
шено напряжение питания, что позволило снизить энергопотребление системы и 
создать более плотные схемы памяти, избегая при этом чрезмерного нагрева. 


Большинство современных процессоров воспринимают системную память как ли- 
нейный массив последовательных адресов. Процессоры с менее изощренной архи- 
тектурой, такие как 6502, напрямую обращаются к микросхемам оперативной па- 
мяти, используя адреса памяти, указываемые в инструкциях. Из-за сложности 
управляющих сигналов и логики управления банками памяти в устройствах 
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ЭОКАМ ООБВ5 современные компьютерные системы оснащают контроллером па- 
мяти, который преобразует каждый линейный адрес процессора в сигналы управ- 
ления и адресации, выбирающие соответствующий модуль ООЕ5 (в системе с не- 
сколькими модулями памяти), группу банков, банк и расположение строк/столбцов 
в выбранном банке. Контроллер памяти — это последовательностное логическое 
устройство, управляющее обменом данными между процессором и модулями опе- 
ративной памяти ОКАМ. Для достижения максимальной производительности сис- 
темы контроллер памяти должен интеллектуально использовать возможности пере- 
крытия операций, предоставляемые модулями памяти ООВ5. 


Сложные современные процессоры обычно интегрируют функцию контроллера 
памяти в саму интегральную схему процессора. Также можно разработать систему 
с отдельным контроллером памяти, который располагается между процессором и 
оперативной памятью. | 


Интерфейс контроллера памяти может содержать несколько каналов, где каждый 
канал представляет собой отдельный путь обмена данными между процессором и 
одним или несколькими модулями памяти. Преимущество выделения нескольких 
каналов в архитектуре памяти заключается в том, что такая конфигурация позволя- 
ет реализовать одновременный доступ к памяти по этим каналам. Однако система, 
содержащая несколько каналов доступа к памяти, не обеспечивает автоматического 
увеличения скорости доступа к памяти. Системное программное обеспечение 
должно активно управлять назначением областей памяти для каждого приложения 
или системного процесса, чтобы сбалансировать использование памяти между ка- 
налами. Если бы операционная система просто последовательно распределяла про- 
цессы по областям физической памяти, сначала заполняя один модуль памяти, а 
затем переходя к следующему, то многоканальный доступ к памяти не принес бы 
никакой пользы, поскольку все процессы были бы вынуждены использовать один и 
тот же канал памяти. 


ООВ для графики 


ООК для графики (отар1с$ ООК, СООК) — это технология памяти ООБК, оптими- 
зированная для использования в качестве оперативной видеопамяти в графических 
контроллерах. СОРОК имеет более широкую шину памяти для поддержки предъяв- 
ляемых средствами отображения требований высокой пропускной способности. 
Стандартная память ООК, с другой стороны, оптимизирована для обеспечения ми- 
нимальной задержки доступа к данным. 


Номера поколений технологий СООЁК и ООК не согласованы друг с другом. По со- 
стоянию на 2021 г. модули ОООК6 доступны уже несколько лет, в то время как 
стандарт ЗОКАМ ООЕ6 по-прежнему находится в разработке. 


Предварительная выборка 


Одним из атрибутов производительности ОКАМ, который весьма незначительно 
улучшается от одного поколения к другому, является скорость чтения или записи 
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конкретного бита. Для того чтобы добиться увеличения средней скорости передачи 
данных в модули ОКАМ и из них, устройства должны использовать другие спосо- 
бы повышения производительности. Одним из методов достижения более высокой 
средней скорости передачи данных является предварительная выборка. 


Идея предварительной выборки заключается в использовании того факта, что 
всякий раз, когда процессор обращается к определенной ячейке памяти, появляется 
вероятность, что вскоре он обратится к адресам, близким к этой исходной ячейке. 
Идея предварительной выборки заключается в чтении большего блока памяти, чем 
один адрес, на который ссылается инструкция процессора, и передаче всего блока 
из устройства ОВАМ в процессор. В контексте модуля памяти ООВ5 размер блока 
обычно составляет 64 байта. 


Модуль ООВ5 может быстро прочитать 64 байта, т.к. он обращается ко всем 
512 битам этих 64 байтов одновременно. Для этого модуль ООК5 считывает целое 
число, кратное 512 шинам битов, из ячеек, выбранных шиной слов. Биты выбран- 
ного ряда считываются одновременно, затем проходят через мультиплексор для 
извлечения нужных 512 бит из (возможно) 8192 бит всего ряда, которые затем фик- 
сируются в выходном регистре. Зафиксированные биты передаются из модуля 
ОКАМ в процессор по тактовому сигналу ООВК. 


При эффективном использовании нескольких групп банков множественные опера- 
ции чтения памяти и передачи полученных данных могут перекрываться по време- 
ни и обеспечивать перемещение данных между модулем памяти и процессором с 
максимальной скоростью, которую может поддерживать интерфейс. 


Получив блок длиной 64 байта, процессор сохраняет эти данные во внутренней 
кеш-памяти и выбирает конкретный элемент данных (возможно, размером всего 
1 байт) из блока, запрашиваемого выполняемой инструкцией. Если последующая 
инструкция обращается к другим данным, содержащимся в том же блоке, процес- 
сору достаточно обратиться к локальному кешу, что приводит к гораздо более бы- 
строму выполнению этой операции, чем с помощью инструкции, которая первона- 
чально извлекала этот блок данных из модуля ОКАМ. 


Помимо взаимодействия с основной памятью, процессор должен обмениваться 
данными с внешним миром через устройства ввода и вывода. В следующем разделе 
рассматривается реализация интерфейсов ввода-вывода в современных компью- 
терных системах. 


Подсистема ввода-вывода 


В главе 3 были представлены две крупные категории архитектур ввода-вывода: 
ввод-вывод с распределением памяти и ввод-вывод с распределением по портам. 
Плюсы и минусы каждого из этих подходов играли существенную роль на заре раз- 
вития персональных компьютеров, когда количество физических адресных линий 
ограничивало общее пространство памяти процессора диапазоном в 1 Мбайт. Ар- 
хитектуры современных процессоров могут адресовать гораздо больший диапазон 
памяти, обычно в десятки гигабайт. Следствием такого расширения адресного про- 
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странства является доступность адресных областей для использования в интерфей- 
сах ввода-вывода. Благодаря этому современные 32- и 64-разрядные процессоры 
общего назначения используют ввод-вывод с распределением памяти для большин- 
ства своих интерфейсов. 


Сложные современные процессоры обычно реализуют контроллер памяти на мик- 
росхеме процессора, напрямую обмениваясь данными с модулями памяти ООК. 
Большинство других типов операций ввода-вывода, выполняемых этими процессо- 
рами, передаются одной или нескольким внешним интегральным схемам, которые 
обычно называют микропроцессорным набором или чипсетом. Термин "чипсет", 
как правило, используется даже в тех случаях, когда для реализации функций вво- 
да-вывода требуется всего одна микросхема. 


Чипсет предоставляет интерфейсы для широкого спектра периферийных устройств, 
включая дисковые накопители, сетевые адаптеры, клавиатуры, мыши и многие дру- 
гие устройства с поддержкой ОЗВ. Большинство этих интерфейсов реализованы на 
основе того или иного вида последовательной шины. В следующих разделах пред- 
ставлены наиболее распространенные технологии ввода-вывода, используемые в 
современных компьютерах. 


Параллельные м последовательные шины данных 


Параллельная шина данных одновременно передает несколько битов данных по 
отдельным проводникам между двумя или большим числом конечных точек. 
В ранних ПК параллельные шины использовались для таких функций, как подклю- 
чение принтера к компьютеру. Со временем стали очевидны некоторые ограниче- 
ния параллельных шин. 


» В зависимости от разрядности для подключения параллельной шины может 
потребоваться много проводов. Это означает, что кабели стоят дороже и су- 
ществует повышенная вероятность возникновения проблем из-за обрыва про- 
водов кабеля или ненадежного электрического контакта в разъемах. 


» По мере того, как разработчики компьютерных систем пытались увеличить 
скорость передачи данных по шине (и тем самым получить конкурентное 
преимущество), существенную роль стало играть еще одно ограничение па- 
раллельных шин: несмотря на то, что устройство, передающее слово данных 
по шине, способно выводить все его биты одновременно, отдельные сигналы 
могут прибывать в точку назначения в разное время. 


Это может быть вызвано различиями в эффективной длине пути в проводни- 
ках кабеля или печатной платы. Этим обстоятельством обусловлено сущест- 
вование верхнего предела скорости передачи данных, которую может под- 
держивать архитектура параллельной шины. 


Еще одно ограничение параллельных шин — они могут передавать данные едино- 
временно только в одном направлении (так называемый полудуплексный режим), 
если не предусмотрен дублирующий набор соединений для одновременной переда- 
чи данных в противоположном направлении. По этой причине параллельные шины 
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обычно не обеспечивают одновременную двустороннюю связь, которую называют 
полнодуплексным режимом. 


Последовательная шина данных передает данные между двумя конечными точками 
по одному биту за раз с помощью пары проводников. Большинство высокоскорост- 
ных каналов связи между процессором и периферийными устройствами в совре- 
менных компьютерах используют тот или иной вариант последовательной шины. 
На первый взгляд, переход от параллельной шины к последовательной влечет за 
собой существенную потерю пропускной способности, однако последовательные 
шины обладают рядом важных преимуществ, которые делают их применение при- 
влекательным при решении задач, предъявляющих высокие требования к произво- 
дительности. 


Высокоскоростные последовательные шины в персональных и коммерческих ком- 
пьютерах передают данные по парам проводников с использованием дифференци- 
альной передачи сигналов. В этом случае используются два проводника, тща- 
тельно подобранных по длине и обладающих почти одинаковыми электрическими 
характеристиками. В кабелях эти проводники представляют собой изолированные 
провода, скрученные друг с другом для образования витых пар. 


На рис. 4.7 представлена последовательная шина данных с дифференциальной пе- 
редачей сигналов. 


Тх Вх 


Рис. 4.7. Схема последовательной шины с дифференциальной передачей сигналов 


Цифровой сигнал, который необходимо передать, поступает в передатчик (обозна- 
ченный Тх) через вход в левой части рисунка. Входной сигнал преобразуется в на- 
пряжения на двух параллельных линиях, показанных в средней части схемы. Ма- 
ленький кружок указывает на то, что сигнал, идущий от передатчика по верхней 
линии, инвертирован относительно сигнала в нижней линии. 


В типичном последовательном интерфейсе высокий уровень сигнала на входе пе- 
редатчика будет генерировать напряжение 1,0 В на верхнем проводнике последова- 
тельной шины и 1,4 В на нижнем проводнике. Входной сигнал низкого уровня при- 
ведет к появлению напряжения 1,4 В на верхнем проводнике и 1,0 В на нижнем 
проводнике. 


Входы приемника (обозначенного Вх) имеют высокое сопротивление — это озна- 
чает, что приемник потребляет незначительный ток из цепи. Приемник измеряет 
напряжение на резисторе, типичное сопротивление которого составляет 100 Ом. 
Когда на входе Тх высокий уровень, верхний вывод резистора находится под на- 
пряжением -0,4 В относительно нижнего вывода. Когда на входе Тх низкий уро- 
вень, верхний вывод резистора находится под напряжением +0,4 В относительно 
нижнего вывода. 
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Приемник генерирует свой выходной сигнал, инвертируя один из входов (верхний 
на рис. 4.7, с маленьким кружком) и добавляя полученное напряжение к напряже- 
нию на другом входе. Другими словами, приемник измеряет только разницу между 
напряжениями на двух проводниках. Фундаментальное преимущество этого подхо- 
да заключается в том, что большинство искажающих сигналы помех вызывает ко- 
лебания напряжения в проводниках, несущих сигнал. При размещении двух про- 
водников очень близко друг к другу большая часть шумового напряжения, 
вносимого в один из проводников, также будет проявляться и в другом проводнике. 
Операция вычитания устраняет большую часть шума, который в противном случае 
мешал бы точному обнаружению сигнала приемником. 


Последовательная шина данных может передавать несколько миллиардов битов в 
секунду, что намного больше, чем параллельная шина в старых ПК. Кроме того, 
можно использовать несколько последовательных шин рядом друг с другом, что 
позволяет умножить пропускную способность в зависимости от количества шин. 


Принципиальное различие между несколькими последовательными шинами, со- 
единяющими две конечные точки, и параллельной шиной, реализующей такое же 
соединение, состоит в том, что во многих стандартах интерфейсов последователь- 
ные шины работают до определенной степени независимо. Для них не требуется 
синхронизация на уровне передачи каждого бита, как в случае передачи по парал- 
лельной шине. Это упрощает устройство соединений, способных поддерживать 
очень высокие скорости передачи данных, при этом нужно заботиться лишь о точ- 
ном соответствии длины проводника и электрических характеристик в каждой паре 
последовательных проводников. 


Связь между современным процессором и чипсетом его материнской платы обычно 
осуществляется по нескольким последовательным шинам данных, называемым ли- 
ниями высокоскоростного ввода-вывода (121-зрее4 тшриё ошриь НО). Каждая 
линия представляет собой последовательное соединение с одним каналом передачи 
данных в каждом направлении (например таким, как на рис. 4.7), благодаря чему 
обмен данными осуществляется в полнодуплексном режиме. 


Отдельные линии НЗГО могут быть назначены определенным типам периферийных 
интерфейсов, реализованных в виде последовательных соединений, таких как РСП 
Ехрге$$, ЗАТА, М.2, ОЗВ и ТвипдегфоН. В следующих разделах представлен каж- 
дый из этих стандартов. 


РС! Ехрге$$ 


Оригинальная шина Ретрвега! Сотропепе ПиегсоппесЕ (РСТ) представляла собой 
32-разрядную параллельную шину, работающую на частоте 33 МГц, которая ис- 
пользовалась в [ВМ РС-совместимых компьютерах примерно с 1995 по 2005 г. 


В разъемы РС на материнских платах компьютеров можно было установить мно- 
жество карт расширения с разными функциями, включая сетевой интерфейс, адап- 
тер дисплея или плату звукового выхода. К началу 2000-х годов ограничения архи- 
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тектуры параллельной шины стали сдерживать дальнейшее развитие, и началась 
разработка замены РС! в виде последовательной шины под названием РС] Ехргез$. 


РСТ Ехрге$$ (РСТе) представляет собой двунаправленную последовательную шину 
с дифференциальной передачей сигналов, используемую в основном для соедине- 
ния конечных точек обмена данными на материнских платах компьютеров. Пропу- 
скная способность Ре выражается в миллиардах пересылок данных (гигатранзак- 
ций) в секунду или ГТ/с. Одна транзакция — это передача одного бита по шине от 
передатчика к приемнику. В каждый многобитный пакет РСТе добавляет дополни- 
тельные избыточные биты для контроля целостности данных. Разные поколения 
РСе используют различное количество этих служебных битов, влияющих на фак- 
тическую скорость передачи данных. В табл. 4.1 приведены данные основных по- 
колений Ре с указанием года их появления, скорости передачи по одной линии в 
гигатранзакциях в секунду (ГТ/с) и эффективной скорости передачи данных в ме- 
габитах в секунду (Мбит/с). 


Таблица 4.1. Поколения шины РС! Ехрге$$ 


Поколение Эффективная скорость 
РСТе _ _ передачи данных 
_ в одну сторону, Мбит/с 


Представленная здесь эффективная скорость передачи данных указана для одно- 
сторонней передачи данных. РСМе поддерживает передачу данных на полной ско- 
рости одновременно в обоих направлениях. 


Стандарты РСШе поддерживают соединения по нескольким линиям, число которых 
обозначается как х1, х2, х4, х8, х16 и х32. Большинство современных материнских 
плат оснащаются как минимум разъемами РЦе х| и х|6. Разъемы РС] х| совмес- 
тимы с краевым разъемом платы длиной 25 мм, а для разъемов х16 требуется крае- 
вой разъем длиной 89 мм. Карта РЦШе будет корректно работать в любом разъеме, 
в который она физически помещается. Например, карту РСе х1 можно вставить в 
разъем х16, и она будет использовать только одну из 16 доступных линий. 


Основная область применения разъемов РСТе х16 — интерфейс между процессором 
и графической картой с целью обеспечения максимальной производительности для 
приложений с интенсивным использованием графики, таких как игры. Интерфейс 
РС 5.0 х16 обеспечивает одностороннюю передачу данных со скоростью 63 Гбит/с. 
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В современных компьютерных архитектурах чип процессора обычно обеспечивает 
прямое соединение с графической картой, установленной в разъем Ре х16, по 
16 линям РСе. Это означает, что передавать сигналы графической карты Ре че- 
рез чипсет не требуется. 


Помимо интерфейсов графической карты и ООВ $ОКАМ, управление большей ча- 
стью операций ввода-вывода в современных компьютерных системах осуществляет 
чипсет. Процессор и чипсет взаимодействуют через набор линий НЗО. Чипсет 
обеспечивает интерфейсы для периферийных устройств, таких как дисковые нако- 
пители, сетевые интерфейсы, клавиатура и мышь. Интерфейсы для этих устройств 
обычно используют стандарты последовательного интерфейса ЗАТА, М.2 и 0ЗВ, 
которые обсуждаются далее. 


ЗАТА 


Зета! АТ АНасвтепЕ (ЗАТА) — это стандарт двустороннего последовательного 
интерфейса для подключения материнских плат компьютеров к устройствам хра- 
нения данных. "АТ" в аббревиатуре ЗАТА относится к 1ВМ РС АТ. Как и одна ли- 
ния Ре, интерфейс ЗАТА содержит две пары проводников с дифференциальной 
передачей сигналов, где по одной паре передаются данные в каждом направлении. 
В отличие от РСе, интерфейс ЗАТА предназначен для работы по кабелям, а не по 
металлическим сигнальным дорожкам на материнских платах. В дополнение к тре- 
бованиям по электрической части и формату данных стандарт ЗАТА содержит 
подробные спецификации совместимых кабелей и разъемов. 


Кабель ЗАТА содержит одну двустороннюю линию, обеспечивающую связь между 
процессором и устройством хранения, таким как накопитель на магнитных дисках, 
дисковод оптических дисков или твердотельный накопитель. В табл. 4.2 приведены 
основные версии стандарта ЗАТА с указанием года появления и рабочих парамет- 
ров каждой из них. 


Таблица 4.2. Поколения стандарта $АТА 


Поколение Год Скорость Эффективная скорость 
ЗАТА появления | передачи, ГТ/с передачи данных 
в одну сторону, Мбит/с 


Скорость передачи данных в этой таблице приведена для односторонней передачи, 
хотя, как и Ре, ЗАТА поддерживает полнодуплексную передачу данных. 


Совершенствование стандарта ЗАТА продолжается, но по состоянию на 2021 г. 
объявлений о следующем поколении ЗАТА с более высокой скоростью передачи 
данных не было. 
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М.2 


В современных твердотельных накопителях (5014-5${а{е дпуе$, $50) для хранения 
данных используется флеш-память, а не вращающиеся жесткие магнитные диски, 
как в традиционных дисковых накопителях. Из-за радикальных отличий техноло- 
гии твердотельных накопителей интерфейс ЗАТА, который в большинстве случаев 
работает достаточно хорошо с накопителями на вращающихся дисках, оказался 
значительным препятствием для эффективной работы твердотельных накопителей. 


Для того чтобы получить доступ к произвольному блоку данных на магнитном 
диске (называемому сектором), головка накопителя должна физически перемес- 
титься на дорожку, содержащую этот сектор, затем дождаться, пока начало сектора 
достигнет положения головки, после чего накопитель сможет начать чтение дан- 
ных. Напротив, твердотельный накопитель может напрямую обращаться к любому 
сектору данных, используя способ, очень похожий на доступ процессора к ячейке 
динамической памяти ОКАМ. 


Спецификация М.2 была разработана для создания компактного и высокопроизво- 
дительного интерфейса доступа к флеш-памяти в небольших портативных устрой- 
ствах. Благодаря этому ограничения интерфейса ЗАТА были устранены, и скорость 
передачи данных увеличилась в несколько раз по сравнению со скоростью интер- 
фейса ЗАТА. 


Помимо работы с запоминающими устройствами М.2 поддерживает и другие ин- 
терфейсы, включая Ре, ОЗВ, Вшеюо и \\!1-ЁЕ1. Современные материнские платы 
содержат разъемы М.2, которые, помимо более высокой пропускной способности, 
занимают гораздо меньше места в корпусе компьютера, чем традиционные отсеки 
для дисковых накопителей. 


0$В 


Интерфейс 0ЗВ (Ошуегза! Зета! Виз) предоставляет собой простой (с точки зре- 
ния пользователя) интерфейс для подключения к компьютерной системе самых 
разных периферийных устройств. В дополнение к протоколам связи версии стан- 
дарта ОЗВ определяют требования к кабелям, разъемам и к подаче питания на под- 
соединенные по кабелю ОЗВ устройства. 


Кабели ОЗВ имеют легко определяемые типы разъемов, а устройства с поддержкой 
ОЗВ поддерживают "горячее" подключение (подключение устройств друг к другу 
при включенном питании). ОЗВ-устройства поддерживают автоматическую на- 
стройку при подключении, и в большинстве случаев пользователям не нужно бес- 
покоиться об установке драйверов при подключении нового устройства к компью- 
теру с помощью ИЗ$В-кабеля. 


Кабели ОЗЪВ ранних версий (до поколения 2.0) содержали одну пару проводов с 
дифференциальной передачей сигналов, которая единовременно могла передавать 
данные только в одном направлении. Более поздние версии стандарта ОЗВ (начи- 
ная с ОЗВ 3.2 поколение 1) поддерживают одновременную двустороннюю переда- 
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чу данных. Кроме того, ИЗВ версии 3.2 и (5В4 содержат до двух линий, что по- 
зволило удвоить скорость передачи данных. 


В табл. 4.3 приведены основные версии стандарта ОЗВ с указанием даты появле- 
ния, максимального количества поддерживаемых линий и максимальной скорости 
передачи данных для каждой из них. 


Таблица 4.3. Поколения стандарта Ц$В 


Поколение Год Количество | Скорость | Эффективная скорость 
05В появления линий передачи, | передачи данных в одну 
ГТА сторону, Мбит/с 


[Залоеиюз | 5 [п 


В поколениях ОЗВ до 2.0 обмен данными полностью находится под управлением 
управляющего компьютера (хоста). Хост инициирует каждую транзакцию обмена 
данными, отправляя пакеты, адресованные конкретному устройству, и осуществля- 
ет передачу данных в устройство или из него. Начиная с ОЗВ 3.2 (поколение 1), 
устройства могут инициировать связь с хостом, что дает подключенным перифе- 
рийным устройствам возможность генерировать прерывания. 


ТрипдегЬой 


Трипдефой — это набор стандартов высокоскоростных последовательных интер- 
фейсов, представленный в 2011г. Оригинальный интерфейс ТБипдегфой сочетал 
передачу сигналов РСе и П1зр1ауРоц с использованием двух последовательных 
линий Трипаегоой. 


Твипаегфой 4 — это последнее поколение стандарта Твипдегфой, добавляющее со- 
вместимость с 0584 и поддерживающее подключение устройств РСТе и несколь- 
ких мониторов высокого разрешения через один компьютерный порт. ТБипдегфо! 4 
использует тот же разъем, что и ОЗВ 3.2 и более поздние поколения (разъем ОЗВ- 
С), и поддерживает скорость передачи данных О$В4 — 40 Гбит/с. ОЗВ-устройства 
при подключении к порту Трипдегфой 4 работают корректно. Однако периферий- 
ные устройства ТБипдегфой 4 несовместимы с портами ЧЗВ-С, отличными от 
ТБопдегФой: 4. 


В следующем разделе представлен обзор наиболее популярных стандартов интер- 
фейсов графических дисплеев. 
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Графические дисплеи 


В играх, редакторах видеоматериалов, графическом дизайне и анимации произво- 
дительность обработки видеоданных имеет решающее значение. Создание и ото- 
бражение графики с высоким разрешением требует огромного объема математиче- 
ских вычислений. 


Процессоры общего назначения могут выполнять необходимые для этого вычисле- 
ния, однако им не хватает производительности, которую ожидают пользователи 
этих приложений. 


Высокопроизводительные графические карты, называемые графическими процес- 
сорами (2тарб1сз ргосеззше ипИз, СОРИ), по сути являются миниатюрными супер- 
компьютерами, в значительной степени оптимизированными для выполнения гра- 
фических вычислительных задач, таких как визуализация трехмерных сцен. 
Поскольку вычисления, связанные с визуализацией сцен, часто повторяются, с по- 
мощью аппаратного распараллеливания можно добиться существенного повыше- 
ния производительности. Графические процессоры содержат большое количество 
относительно простых вычислительных блоков, каждый из которых выполняет не- 
большую часть общей задачи. 


Графический процессор может содержать тысячи отдельных процессоров, каждый 
из которых выполняет функции АЛУ. Первоначальной движущей силой, которая 
привела к разработке высокопроизводительных графических процессоров, было 
построение трехмерных сцен, однако более поздние поколения этой технологии 
нашли широкое применение в таких областях, как анализ больших данных и ма- 
шинное обучение. Архитектура графического процессора позволяет ускорить ре- 
шение любой вычислительной задачи с интенсивными вычислениями, которую 
можно разбить на набор параллельных операций. 


Конечно, не всем пользователям нужна сверхвысокая производительность при об- 
работке видеоданных. Для удовлетворения потребностей пользователей со скром- 
ными требованиями к работе с графикой и ограниченным бюджетом в современные 
процессоры часто встраивают графический процессор средней производительно- 
сти. Во многих приложениях такой подход обеспечивает более чем достаточную 
производительность обработки графических данных. Такая конфигурация называ- 
ется конфигурацией с интегрированной графикой — это означает, что функция 
графического процессора интегрирована в кристалл процессора и использует об- 
щую системную память совместно с процессором. Компьютерные системы с интег- 
рированной графикой дешевле, но обеспечивают достаточную графическую произ- 
водительность для решения основных вычислительных задач, таких как работа с 
электронной почтой, просмотр веб-страниц и видеозаписей. 


Многие настольные компьютерные системы, а также некоторые ноутбуки имеют 
встроенный графический процессор, предлагая возможность установки высокопро- 
изводительной графической карты. Это дает пользователям возможность адаптиро- 
вать компьютерную систему к своим потребностям по цене и производительности. 
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В настоящее время для подключения мониторов к компьютерам используется не- 
сколько различных стандартов видеосигналов. Поскольку выходные сигналы, гене- 
рируемые графическим интерфейсом компьютера, должны быть совместимы с под- 
ключенным монитором, компьютеры обычно оснащают видеоразъемами несколь- 
ких типов. Компьютерные мониторы и телевизоры высокой четкости обычно также 
предлагают выбор интерфейсов подключения. 


В главе б архитектура средств обработки графических процессоров будет рассмот- 
рена более подробно. В следующих разделах описываются стандарты компьютер- 
ных видеоинтерфейсов прошлого и настоящего. 


УСА 


Видеостандарт У14ео СгарШс$ Аггау (УСА) для персональных компьютеров был 
представлен компанией 1ВМ в 1987 г. УСА — это аналоговый интерфейс, который 
широко применяется и сегодня, хотя большинство современных компьютеров не 
имеют разъема УСА. Нередко старые компьютеры с видеовыходами УСА исполь- 
зуют кабель-переходник для передачи изображения на монитор, поддерживающий 
видеовход ОУ[ или НОМ. 


Современные версии стандарта УСА поддерживают разрешение до 1920 пикселов 
в ширину и 1200 пикселов в высоту с частотой обновления 60 Гц. Поскольку ви- 
деосигнал УСА является аналоговым, при передаче на монитор происходит неко- 
торая потеря качества сигнала. Этот эффект наиболее заметен при высоких разре- 
шениях экрана. 


ОУ 


Видеостандарт О!рНа| У15иа! Пие асе (БУТ) был разработан для улучшения визу- 
ального качества компьютерного изображения за счет передачи с компьютера на 
монитор цифрового видеосигнала. Для обеспечения обратной совместимости со 
старыми компьютерами и мониторами по кабелям ОУ[Г также можно передавать 
аналоговые сигналы УСА. 


Подобно высокоскоростным последовательным интерфейсам, рассмотренным ра- 
нее в этой главе, для передачи видеоданных БУГ использует последовательную 
дифференциальную передачу сигналов. Разъем ОУТ содержит четыре последова- 
тельные линии. Отдельные линии несут информацию о красном, зеленом и синем 
цветах, а по четвертой линии передается общий тактовый сигнал. 


Определены три варианта ОУ] в зависимости от комбинации поддерживаемых ти- 
пов цифровых и аналоговых видеосигналов. 


» ОУ|-А поддерживает только аналоговый видеосигнал. Этот вариант интерфей- 
са предназначен для обеспечения обратной совместимости с компьютерами и 
мониторами УСА. Разъем РУ]-А имеет другое расположение контактов по 
сравнению с традиционными разъемами УСА, поэтому для подсоединения к 
устаревшим устройствам УСА требуется кабель-переходник. 
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» ЮПУ|-О представляет собой исключительно цифровой интерфейс, поддержи- 
вающий одноканальный и двухканальный варианты. Двухканальный вариант 
предоставляет дополнительные линии последовательной передачи данных, 
чтобы увеличить пропускную способность для дисплеев с более высоким 
разрешением. "Двухканальный" не означает, что кабель поддерживает два 
монитора. 


» БУ!- представляет собой интегрированный интерфейс, поддерживающий 
как аналоговый интерфейс ОУ1-А, так и цифровые режимы ОУ1-О. Цифровой 
интерфейс ОУ]-[ может быть как одноканальным, так и двухканальным. 


Интерфейсы БУГ используются в основном в компьютерных мониторах. Эффек- 
тивная скорость передачи данных одноканального соединения ОУ1-О составляет 
3,96 Гбит/с. Двухканальный ОУ[-О передает видеоданные вдвое быстрее, чем од- 
ноканальный: 7,92 Гбит/с. 


ном 


Мультимедийный интерфейс высокой четкости НВ-Оейш@оп Мефа Пиегасе 
(НОМП) поддерживается большинством современных компьютеров и мониторов, 
а также практически всеми современными телевизорами и связанными с ними раз- 
влекательными видеоустройствами, такими как ОУО-плееры. НОМТ поддерживает 
только цифровые видеоданные (поддержка аналоговых сигналов отсутствует) и 
использует ту же дифференциальную последовательную шину, что и ОУ1-О. В до- 
полнение к видеоданным кабели НОМГ также передают многоканальный цифровой 
аудиосигнал. 


С момента введения в 2002 г. стандарт НОМГ претерпел несколько редакций. Каж- 
дая последующая версия поддерживала обратную совместимость, добавляя новые 
возможности. В поздних версиях стандарта увеличена пропускная способность, 
расширен диапазон поддерживаемых разрешений экрана, добавлена поддержка 
звука высокой четкости и Еете-подключения по кабелю НОМ, а также функции 
для поддержки игр. Каждая версия НОМ] совместима с прежними версиями, одна- 
ко новые функции доступны только в конфигурациях, в которых устройство- 
источник сигнала, устройство отображения и соединительный кабель совместимы с 
новым стандартом. 


Стандарт НОМГ версии 2.1 был опубликован в 2017 г. Он поддерживает эффектив- 
ную скорость передачи данных 42,6 Гбит/с по четырем дифференциальным после- 
довательным линиям. 


О:зр[ауРо!г1 


Стандарт О1зр!ауРоц, введенный в 2006 г., описывает цифровой интерфейс, под- 
держивающий цифровое видео, аудио и ОЗВ-соединения. В то время как стандарт 
НОМГ ориентирован на бытовую электронику, включая телевизоры и домашние 
кинотеатры, О15р1ауРой нацелен на вычислительную технику. О1зр!ауРой передает 
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данные в пакетах со встроенной в каждый пакет информацией о синхронизации, 
что устраняет необходимость в отдельном канале синхронизации. 


Один выход О1$р1ауРой компьютера может управлять несколькими мониторами, 
соединенными в гирляндную цепь, где один кабель соединяет компьютер с первым 
монитором, второй кабель соединяет первый и второй мониторы и т. д. Используе- 
мые мониторы должны поддерживать такую функцию. Максимальное количество 
мониторов, которые можно соединить таким образом, ограничено только возмож- 
ностями видеокарты, максимальной пропускной способностью кабеля, а также раз- 
решением и частотой обновления мониторов. 


Версия О1зрауРоп 2.0, выпущенная в 2019 г., поддерживает эффективную скорость 
передачи данных до 77,4 Гбит/с по четырем дифференциальным последовательным 
ЛИНИЯМ. 


Сетевой интерфейс 


Компьютерная сеть — это совокупность цифровых устройств, взаимодействующих 
через общую среду связи. Локальная сеть (1оса| агеа пебмогК, ГАМ) состоит из 
ограниченного числа компьютеров, которые могут находиться в одном физическом 
месте, например в жилом доме или в офисном здании. Подключенные друг к другу 
компьютеры, телефоны и другие цифровые устройства в вашем доме представляют 
собой локальную сеть. Для соединения устройств в среде локальной сети можно 
использовать проводной интерфейс, обычно Ефегпеф или беспроводной интерфейс, 
обычно \\!1-Е1. 


Территориально удаленные друг от друга компьютеры и локальные сети обмени- 
ваются данными с помощью глобальной сети (\14е агеа пебхогк, \УАМ). Сервисы 
глобальной сети часто предоставляются операторами связи, такими как поставщи- 
ки кабельного телевидения или телефонные компании. Ваша домашняя локальная 
сеть, вероятнее всего, подключена к Интернету через сервис глобальной сети, пре- 
доставляемый вашим оператором телефонной связи или кабельной сети. 


Устройства сетевого интерфейса для домашних и корпоративных сетей (маршру- 
тизаторы), предоставляемые поставщиками услуг глобальной сети, обычно пред- 
лагают поддержку Е®еге или \\1-Е!1 для подключения локальных устройств к гло- 
бальной сети. В следующих разделах представлены технологии Еегпей и \М1-Е1. 


ЕМегпе}! 


ЕПегпе! представляет собой набор сетевых стандартов для соединения компьюте- 
ров в локальную сеть с помощью кабелей. Первоначальная версия Еегпе{ была 
разработана в 1974 г. Робертом Меткалфом (Кобеи МекаШ), работавшим в иссле- 
довательском центре Хегох в Пало-Альто. Стандарт Ефегте{ был запущен в ком- 
мерческую эксплуатацию в 1980 г. как технология связи со скоростью 10 Мбит/с 
для групп компьютеров, соединенных коаксиальным кабелем. Название технологии 
произошло от исторического термина [итийетои5з аешег (светоносный эфир), обо- 
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значающего гипотетическую среду, заполняющую все пространство и обеспечи- 
вающую распространение электромагнитных волн. Кабель Ефеге! служит концеп- 
туально похожей средой связи. 


Институт инженеров по электротехнике и электронике ([шзийке оЁ Еесйлса| апд 
Еесбогис Епршеегз, ТЕЕЕ) начал разработку стандартов для технологий локальных 
сетей, включая Ефегтеь в 1980 г. Стандарт Ефегте! ТЕЕЕ 802.3 был опубликован в 
1985 г. С тех пор он претерпел ряд изменений, включая увеличение скорости пере- 
дачи данных и добавление различных топологий сети. Наиболее очевидным отли- 
чием современных компьютерных сетей от исходного стандарта Еегпе{ является 
использование двухточечных кабелей с витыми парами вместо общего коаксиаль- 
ного кабеля. 


Современные компьютеры обычно используют интерфейсы Слраби Ефете для 
обмена данными по кабелям с неэкранированными витыми парами (ип5зме!4дед 
5\1$е4-рат, ОТР). Интерфейс Слраб Ефете! официально определен в стандарте 
ТЕЕЕ 802.3а6 и поддерживает скорость передачи данных 1,0 Гбит/с (эффективная 
скорость достигает 99% исходной скорости), хотя количество добавляемых слу- 
жебных данных значительно варьирует в зависимости от используемого протокола 
связи. 


Передача данных через интерфейс Ефете! осуществляется блоками данных пере- 
менного размера, называемых кадрами, которые могут содержат до 1518 байт. За- 
головок каждого кадра содержит адресную информацию, идентифицирующую ин- 
терфейсы Е®феге источника и получателя. Поскольку современные соединения по 
витой паре являются двухточечными, наиболее распространенной схемой для со- 
единения группы компьютеров является прокладка кабеля от каждого компьютера 
к коммутатору. Коммутатор — это устройство, которое принимает кадры, переда- 
ваемые подключенными компьютерами, и на основе адреса получателя, указанного 
в каждом кадре, сразу же пересылает их правильному получателю. Максимальная 
рекомендованная длина кабелей ЕФете! составляет 100 метров, что ограничивает 
физический размер локальной сети Еете" такой областью, как отдельное офисное 
здание или жилой дом. 


Современные материнские платы обычно содержат встроенный интерфейс Ефегтеь, 
что избавляет от необходимости использовать разъем РСТе с картой Е\фегпее. Ин- 
терфейс Етете, встроенный в материнскую плату или установленный в разъем 
расширения РСТе, использует одну линию НО, соединяющую процессор через 
чипсет с интерфейсом Ефегпей. 


\/-Е! 
Институт ТЕЕЕ выпустил первую версию стандарта беспроводной связи 802.11 в 
1997 г. Эта версия поддерживала скорость передачи данных 2 Мбит/с в частотном 


диапазоне 2,4 ГГц. Стандарт 802.116, выпущенный в 1999 г. и поддерживавший 
скорость передачи данных 11 Мбит/с, оказался коммерчески успешным. Эта техно- 
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логия получила название \!1-Е! в 1999 г. с отсылкой к термину "Ш-ЁН", обозначаю- 
щему высокоточное воспроизведение звука. 


Версия 802.112, выпущенная в 2003 г., поддерживает исходную скорость передачи 
данных 54 Мбит/с. Версия 802.1]п, выпущенная в 2009 г., также поддерживает 
технологию использования нескольких передающих и нескольких приемных 
антенн (ти]аре-шри-тиш@р]е-ошриь ММО) и работу в диапазоне 5 ГГц. Стан- 
дарт 802.1 Пас, опубликованный в 2013 г., поддерживает скорость передачи данных 
в диапазоне 5 ГГц более 500 Мбит/с при использовании конфигураций с антеннами 
МИМО. Стандарт 802.1 1ах, утвержденный в 2021 г., обеспечивает увеличение про- 
пускной способности на 39% по сравнению со стандартом 802.1 [ас для одного кли- 
ента и предлагает расширенную поддержку при использовании в средах с высокой 
плотностью радиосигналов. Версия 802.11ах продвигается под наименованием "\\1- 
Е! 6" для работы в диапазонах 2,4 и 5 ГГц и "\/1-Р! 6Е" — для работы в диапазоне 
6 ГГц. 


Устройства \\1-Е! могут страдать от помех, создаваемых бытовыми приборами, та- 
кими как беспроводные телефоны, микроволновые печи и другие сети У\/1-ЁЕ1, рабо- 
тающие поблизости. На распространение сигнала \/1-Е!1 влияют такие факторы, как 
стены и другие препятствия между передатчиком и приемником, многолучевое 
распространение сигнала (ослабляющая интерференция между сигналом, распро- 
страняющимся по прямому пути, и его отраженной копией), а также максимальная 
мощность, которую разрешено излучать передатчикам \!1-Ё1. Использование не- 
скольких антенн в конфигурациях 802.11п, 802.1 1ас и 802.1 1ах значительно снижа- 
ет влияние многолучевого распространения сигналов на качество передачи данных. 


Современные маршрутизаторы глобальных сетей, предоставляемые операторами 
связи, обычно содержат комбинацию интерфейсов Ефегпе! и \!1-Е1. Основным пре- 
имуществом \1-ЁЕ1 по сравнению с Ефете! для этих приложений является сокра- 
щение количества используемых кабелей. 


Одним из недостатков \1-Ё1 является возможное нарушение безопасности, по- 
скольку радиочастотный сигнал может распространяться далеко за пределы здания, 
в котором находятся системы связи. Стандарты \/1-Е1 обеспечивают необходимую 
поддержку безопасности связи с помощью таких протоколов, как \\1-Е! Ргоесе@ 
Ассез$$ 2 (\УРА2), но системные администраторы и пользователи должны убедиться 
в том, что соответствующие функции безопасности включены и секретные данные, 
такие как пароль доступа к сети, который при этом должен быть достаточно слож- 
ным, надежно защищены. 


Поддержка \!1-ЁЕ! реализована в большинстве портативных мобильных устройств, 
таких как ноутбуки, смартфоны и планшеты, и непосредственно встроена во мно- 
гие материнские платы. 


В следующем разделе представлены компьютерные интерфейсы с наименьшими 
требованиями к пропускной способности: клавиатура и мышь. 
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Клавиатура и мышь 


По сравнению с высокоскоростными интерфейсами, рассмотренными ранее в этой 
главе, требования к пропускной способности для клавиатуры и мыши весьма 
скромны. Эти устройства поддерживают единственные методы ввода, используе- 
мые человеком-оператором в большинстве конфигураций компьютеров, поэтому от 
них требуется работа со скоростью человеческих действий. Даже самая быстрая 
машинистка может нажимать клавиши со скоростью не более одного-двух десятков 
нажатий в секунду. 


Клавиатура 


Механическая компьютерная клавиатура состоит из набора клавиш, каждая из ко- 
торых приводит в действие электрический переключатель мгновенного действия. 
Стандартная полноразмерная клавиатура обычно содержит 104 клавиши, включая 
клавиши со стрелками, клавиши управления (<Ноте>, <ЗсгоЙ ГосК> и т. д.) и до- 
полнительную клавиатуру для ввода цифр. Для подсоединения к компьютеру со- 
временные клавиатуры обычно используют ЧЗВ-кабель или беспроводную связь. 


Поскольку требования к пропускной способности при взаимодействии с человеком 
настолько малы, некоторые материнские платы компьютеров снабжены относи- 
тельно медленным портом ОЗВ 2.0 для подключения клавиатуры, одновременно 
предлагая более быстрые интерфейсы ОЗВ 3.2 и выше для высокоскоростных пе- 
риферийных устройств. Это приводит к небольшому снижению стоимости компо- 
нентов материнской платы. 


Поскольку клавиатура сообщает о нажатии и отпускании каждой клавиши отдель- 
но, компьютер может обрабатывать одновременные нажатия комбинаций клавиш. 
Например, результатом нажатия клавиши <А> при удержании нажатой клавиши 
<ЗЫЙ> является ввод заглавной буквы А. 


Некоторые компьютеры и мобильные устройства, такие как планшеты и телефоны, 
оснащены интерфейсом с сенсорным экраном. Когда на этих устройствах требуется 
ввод текста, система отображает на экране клавиатуру, и пользователь касается 
букв, чтобы произвести нажатие клавиш. 


Механические клавиатуры, как правило, обеспечивают более точный ввод, и их 
предпочитают пользователи, вводящие значительное количество текста. Поскольку 
поверхность сенсорного экрана абсолютно плоская, пальцы пользователя не ощу- 
щают нажатия клавиш. Это приводит к более частым ошибкам ввода при использо- 
вании клавиатуры на сенсорном экране. И конечно же, при наличии клавиатуры, 
отображаемой на сенсорном экране, нет необходимости использовать механиче- 
скую клавиатуру, что является существенным преимуществом для мобильных уст- 
ройств. Кроме того, ввод с помощью сенсорной клавиатуры не подвержен физиче- 
ским отказам, которые могут возникать в механических деталях клавиатур. Для 
пользователей в перчатках ввод текста затруднен как на сенсорных экранах, так и 
на клавиатурах. 
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Мышь 


Компьютерная мышь — это ручное устройство, которое перемещает указатель по 
экрану компьютера в горизонтальном и вертикальном направлениях. Пользователь 
инициирует требуемые действия в зависимости от местоположения указателя, на- 
жимая кнопки мыши. Современные мыши часто имеют небольшое колесико, спо- 
собное вращаться в любом направлении и используемое для выполнения таких за- 
дач, как прокрутка документа. 


Как и клавиатура, мышь обычно подключается к компьютеру через интерфейс 0$В 
по проводному или беспроводному соединению. Мышь предъявляет низкие требо- 
вания к пропускной способности, для удовлетворения которых достаточно порта 
ОЗВ 2.0. 


Для работы мыши требуется ровная горизонтальная поверхность, обычно столеш- 
ница, по которой пользователь перемещает мышь. Современные мыши чаще всего 
используют оптические излучатели и датчики для обнаружения их перемещения по 
поверхности. Многим моделям мышей трудно работать на сильно отражающих по- 
верхностях, таких как стеклянные столешницы. 


Трекбол по своей концепции похож на мышь, за исключением того, что вместо пе- 
ремещения мыши по поверхности шарик удерживается в фиксированном положе- 
нии, но его можно вращать в любом направлении с помощью движений руки. Катая 
шарик вперед, назад, влево и вправо, пользователь может перемещать указатель на 
дисплее. 


Трекболу не требуется столько места на поверхности, сколько нужно мыши, и его 
можно установить стационарно. Возможность жестко закрепить трекбол делает его 
предпочтительным указательным устройством для компьютерных станций, уста- 
новленных на транспортных средствах, включая наземный, морской и воздушный 
транспорт. 


Как ив случае с клавиатурой, компьютер определяет нажатие и отпускание каждой 
кнопки мыши как отдельные события. Пользователи могут использовать эту во3- 
можность для выполнения таких операций, как перетаскивание значка по экрану. 
Для этого нужно выполнить следующие действия: 


1. Наведите указатель на значок. 

2. Нажмите и удерживайте левую кнопку мыши. 

3. Переместите указатель (с прикрепленным к нему значком) в нужное место. 
4. Отпустите кнопку мыши. 


Вместе клавиатура и мышь обеспечивают все возможности ввода, необходимые 
большинству пользователей компьютеров для выполнения интерактивных задач. 


В следующем разделе собраны описания подсистем из этой главы для оценки ха- 
рактеристик материнской платы современного компьютера. 
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Технические характеристики современной 
компьютерной системы 


С помощью информации, содержащейся в этой главе, вы сможете разобраться в 
большинстве технических характеристик материнской платы, процессора и чипсета 
современного компьютера. В этом разделе приведен пример характеристик совре- 
менной (на 2021 г.) материнской платы с некоторыми пояснениями по отдельным 
функциям. 


Разработчики материнских плат компьютеров должны принять ряд решений, на- 
пример о количестве разъемов для карт расширения РШе, разъемов ОММ, портов 
ОЗВ и ЗАТА, которые должны быть включены в состав конкретной модели мате- 
ринской платы. Эти решения принимаются на основе целевой демографической 
группы потребителей, будь то геймеры, бизнес-пользователи или экономные до- 
машние пользователи. 


В качестве примера материнской платы возьмем АЗИЗ Рите Х570-Рго (табл. 4.4). 
Это высокопроизводительная плата, предназначенная для игровых приложений и 
поддерживающая игровые функции, такие как разгон процессора. Разгон — это 
увеличение тактовой частоты процессора и других компонентов системы с целью 
повышения производительности. 


Разгон также увеличивает тепловыделение и может привести к нестабильной рабо- 
те устройства, если оно работает на чрезмерной частоте. 


Таблица 4.4. Пример технических характеристик материнской платы 


Компонент | Характеристика Примечания 


Процессор |Гнездо АМО АМА, совмести- |Гнездо содержит 1331 контакт. Процессор 
мое с процессорами АМО взаимодействует напрямую с системной па- 
Вугеп"М третьего поколения |мятью ООВ4. Имеется интерфейс РС! 4.0 


х16, напрямую связывающий процессор с 
графическим процессором 


Чипсет АМО Х570. Интерфейс между процессором и чипсетом: 
16 линий РСЁе 4.0. РСТе 4.0 х4 
6 портов ЗАТА, 6 Гбит/с 


Графическая | До 3 разъемов РСШе 4.0 х16 Возможна параллельная работа нескольких 
графических процессоров через масштаби- 
руемый интерфейс обмена данными Му1Ча 
ЗемаЫе ГлиКк Пицег{асе (5Т.Т) или с помо- 
щью технологии АМР Сгоз$Вге 


Разъемы 3 разъема РСТе 4.0 х16. Разъемы х16 можно сконфигурировать как 
расширения |3 разъема РСе 4.0 х! один разъем х16, два разъема х8 или два 
разъема х8 плюс один разъем х4 
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Таблица 4.4 (окончание) 


Компонент | Характеристика Примечания 


Системная |4 двухканальных разъема Можно установить до четырех модулей 
память для модулей ОПММ 02ОВ4 0084 объемом до 32 Гбайт каждый. Воз- 
3200 МГц с общей емкостью |можен разгон до 5100 МГц 

до 128 Гбайт 


Интерфейсы |2 разъема М.2. Разъемы М.2 используют интерфейс РС! 4.0 

накопителей | 6 разъемов ЗАТА, 6 Гбит/с для подключения быстродействующих твер- 
дотельных накопителей. Разъемы ЗАТА 
предназначены для поддержки традицион- 
ных дисковых накопителей 


Ебете 1 порт Слраби Ефете Высокоскоростное подключение к сети 
ЕФфете 


0$В 2 разъема ОЗВ 2.0. Каждый разъем поддерживает несколько 
1 разъем ОЗВ 3.2, портов ОВ. Порты ЦЗВ 2.0 предназначены 


поколения | (5 Гбит/с). для клавиатуры и мыши. 
1 разъем ОЗВ 3.2, Порты ОЗВ 3.2 предназначены для быстрых 


поколения 2 (10 Гбит/с) периферийных устройств, таких как внеш- 
ние накопители 


Этот пример предназначен для того, чтобы дать некоторое представление о харак- 
теристиках компьютеров потребительского класса в верхнем ценовом сегменте по 
состоянию на 202 | г. 


/ Если вы собираетесь приобрести компьютер, можете использовать ин- 
\ я» — формацию из этой главы, чтобы стать более информированным потре- 
бителем. 


Резюме 


Эта глава началась с введения в устройство элементарной ячейки памяти компью- 
тера, состоящей из полевого МОП-транзистора и конденсатора. Мы изучили схему, 
реализующую битовую ячейку динамической памяти ОКАМ. Мы рассмотрели ар- 
хитектуру модулей памяти ООЕ5 и работу многоканальных контроллеров памяти. 
Были представлены другие типы устройств ввода-вывода и отдельно рассмотрены 
высокоскоростные дифференциальные последовательные соединения, широко ис- 
пользуемые в таких технологиях, как Ре, ЗАТА, ЦЗВ, и видеоинтерфейсы. 


Были описаны популярные видеостандарты, включая УСА, ОУ, НОМГ и 
О15рауРоп. Мы также рассмотрели сетевые технологии Ефетее и \\1-Е1. Затем об- 
судили стандартные интерфейсы компьютерной периферии, включая клавиатуру и 
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мышь. Глава завершилась описанием примерных характеристик современной мате- 
ринской платы с выделением некоторых интересных особенностей. 


Благодаря информации, представленной в этой главе, у вас должно сложиться чет- 
кое представление о компонентах современных компьютеров, начиная с уровня 
технических характеристик и заканчивая технологиями, используемыми при реали- 
зации схем. 


В следующей главе мы рассмотрим функции более высокого уровня, которые 
должны быть реализованы в компьютерных системах, такие как ввод-вывод для 
накопителей, обмен данными по сети и взаимодействие с пользователями. Мы изу- 
чим уровни программного обеспечения, реализующие эти функции, начиная с 
уровня набора инструкций и регистров процессора. Будет рассмотрен ряд ключе- 
вых аспектов операционных систем, в том числе начальная загрузка, многопоточ- 
ность и многопроцессорность. 


Упражнения 


1. Составьте схему реализации логического элемента И-НЕ, используя две пары 
МОП-транзисторов, объединенных в КМОП-структуры. В отличие от схем вен- 
тилей на основе п-р-п-транзисторов, для этой схемы не требуются резисторы. 


2. 16-гигабитная интегральная схема памяти ОКАМ имеет два входа выбора груп- 
пы банков, два входа выбора банка и 17 входов выбора адресов строк. Сколько 
битов в каждой строке банка в этом устройстве? 


Аппаратно-программный интерфейс 


Большая часть программного обеспечения компьютеров написана не на уровне ин- 
струкций процессора, т. е. не на языке ассемблера. Почти все приложения, с кото- 
рыми мы ежедневно работаем, написаны на том или ином языке программирования 
высокого уровня на основе уже существующих библиотек возможностей, которые 
разработчики приложений использовали в процессе разработки программного 
обеспечения. Применяемые на практике среды программирования, включающие в 
себя языки высокого уровня и связанные с ними библиотеки, предлагают множест- 
во сервисов, в том числе функции ввода-вывода дисковых накопителей, обмен 
данными по сети и взаимодействие с пользователями, которые легко доступны из 
программного кода. 


В данной главе описываются уровни программного обеспечения, реализующие эти 
функции, начиная с инструкций процессора в драйверах устройств. Здесь будет 
рассмотрен ряд ключевых аспектов операционных систем, включая начальную за- 
грузку, планирование процессов, многопоточность и многопроцессорность. 


Прочитав эту главу, вы получите представление о сервисах, предоставляемых опе- 
рационными системами и функциями базовой системы ввода вывода (ВТОЗ) и 
единого расширяемого интерфейса встроенного ПО (ОтВед Ежеп Ые Еитугаге 
Пуегасе, ЧЕЕ). Вы узнаете, как потоки вычислений функционируют на уровне 
процессора и как несколько процессорных ядер координируют свои действия в 
компьютерной системе. Вы также получите общее представление о процессе безо- 
пасной загрузки операционной системы, начиная с выполнения первой инструкции. 


Мы рассмотрим следующие темы: 
» драйверы устройств; 
» базовая система ввода-вывода; 
» процесс загрузки операционной системы; 


е операционные системы, 


е процессы и потоки, 


е многопроцессорность. 


Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 
Вр: //ривиЬ.сот/РаскЕРИБИ$ то/Модегп-Сотршег-АгспЦес@ге-апд- 
Оггап17аНопт-Зесопд-ЕЧ оп. 


Драйверы устройств 


Драйвер устройства предоставляет программным приложениям стандартизирован- 
ный интерфейс для взаимодействия с периферийными устройствами, такими как 
дисковые накопители. Это избавляет разработчика приложения от необходимости 
понимать и реализовывать все технические детали, требуемые для надлежащей ра- 
боты устройств каждого типа. Драйверы устройств также обеспечивают необходи- 
мую координацию, когда приложения, написанные разными разработчиками, пы- 
таются одновременно получить доступ к одному и тому же устройству. 
Большинство драйверов устройств позволяют нескольким приложениям безопасно 
и эффективно взаимодействовать с несколькими экземплярами соответствующих 
периферийных устройств. 


На самом низком уровне код драйвера устройства предоставляет программные ин- 
струкции, которые управляют обменом данными с периферийным устройством, 
включая обработку прерываний, инициируемых запросами на обслуживание, от- 
правляемыми в устройство. Драйвер устройства управляет работой аппаратных ре- 
сурсов процессора, периферийного устройства и других компонентов системы, та- 
ких как чипсет процессора. 


В компьютерных системах, поддерживающих привилегированные режимы выпол- 
нения, драйверы устройств обычно работают с повышенным уровнем привилегий. 
Код, работающий с повышенным уровнем привилегий, которые обычно ограниче- 
ны операционной системой и драйверами устройств, имеет полный доступ к воз- 
можностям процессора и периферийных устройств. Этот уровень гарантирует пре- 
доставление доступа к ресурсам ввода-вывода, недоступным для кода с меньшими 
привилегиями. Только доверенный код может напрямую взаимодействовать с эти- 
ми интерфейсами. Если бы код непривилегированного приложения мог получить 
доступ к аппаратному интерфейсу периферийного устройства, то программная 
ошибка, вызвавшая неправильное поведение устройства, могла бы оказать непо- 
средственное влияние на все приложения, пытающиеся использовать это устройст- 
во. Действия, связанные с переключением потока выполнения инструкций и дан- 
ных между непривилегированным кодом пользователя и привилегированным 
кодом драйвера, будут обсуждаться в главе 9. 
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Драйверы, которые выполняются с повышенными привилегиями, называются 
драйверами режима ядра. Ядро — это центральный элемент операционной сис- 
темы, служащий интерфейсом между аппаратными средствами компьютера и 
функциями операционной системы более высокого уровня, такими как планировщик. 


Как мы узнали из главы 3, для доступа к устройствам ввода-вывода используются 
два основных механизма: с распределением памяти и с распределением по портам. 
В современных компьютерах преобладает ввод-вывод с распределением памяти, 
однако в некоторых архитектурах, таких как х86, по-прежнему поддерживается и 
используется ввод-вывод с распределением по портам. В архитектуре х86 многие 
современные периферийные устройства предоставляют системный интерфейс, со- 
четающий оба механизма ввода-вывода. 


Инструменты программирования для современных операционных систем, таких 
как [лпих и \/1140%$, предоставляют ресурсы для разработки драйверов устройств, 
способных взаимодействовать с периферийными устройствами, используя методы 
ввода-вывода как с распределением по портам, так и с распределением памяти. Ус- 
тановка драйвера устройства в этих операционных системах требует повышенных 
привилегий, но пользователям драйвера такие привилегии не требуются. 


Драйверы современных периферийных устройств могут быть довольно сложными 
и трудными для понимания теми, кто не слишком хорошо знаком с аппаратной ча- 
стью и встроенным ПО таких устройств, однако некоторые устройства прежних 
поколений довольно просты. Одним из примеров таких устройств является парал- 
лельный порт принтера, который был введен в ранних моделях персональных ком- 
пьютеров и в течение многих лет оставался стандартным компонентом ПК. Совре- 
менные компьютеры редко оснащаются этими интерфейсами, однако недорогие 
карты расширения с параллельными портами остаются легкодоступными, а совре- 
менные операционные системы обеспечивают поддержку драйверов для этих ин- 
терфейсов. Любители электроники часто используют параллельный порт в качестве 
простого интерфейса для подключения к ПК под управлением Глпих или \/190\$ 
внешних схем, использующих 5-вольтовые цифровые сигналы транзисторно- 
транзисторной логики (ТТЛ). 


В следующем разделе будут рассмотрены детали интерфейса параллельного порта 
на уровне драйвера устройства. 


Параллельный порт 


Программный интерфейс для параллельного порта принтера на ПК состоит из трех 
8-разрядных регистров, изначально привязанных к последовательным номерам 
портов ввода-вывода, начиная с шестнадцатеричного значения 378. Этот набор 
портов обеспечивает работу интерфейса для системного принтера № 1, обозначае- 
мого как Г.РТ1 на ВМ РС-совместимых компьютерах под управлением М$-ОО$ и 
\У/тдо\5. Современные ПК могут сопоставлять параллельный порт с другим диапа- 
зоном портов ввода-вывода во время инициализации шины РетрВега! СотропепЕ 
ПиегсоппесЕ (РСГ), но в остальном по сравнению с ранними ПК работа этого ин- 
терфейса не изменилась. 
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Драйверы устройств для параллельного порта в современных компьютерах выпол- 
няют те же функции, используя те же инструкции, что и в ранних ПК. В этом раз- 
деле мы предположим, что порт принтера сопоставлен с традиционным диапазоном 
портов ввода-вывода в 64-разрядной версии Глпих. 


Для взаимодействия с аппаратной частью параллельного порта процессор х86 вы- 
полняет инструкции 1п и оц\, обеспечивающие чтение из портов ввода-вывода и 
запись в них. 


Если предположить, что драйвер параллельного порта установлен и инициализиро- 
ван, то пользовательское приложение может вызвать функцию драйвера для чтения 
состояния линий передачи данных параллельного порта и записи в них. 


Следующие инструкции драйвера считывают дискретные уровни напряжения, при- 
сутствующие на восьми линиях передачи данных параллельного порта, и сохраня- 
ют полученное 8-битное значение в регистре а1 процессора: 


оу едх,@х378 
]п а!1, 4х 


На языке ассемблера х86 инструкции с двумя операндами записываются в виде оп- 
код адресат, источник. В этом примере использованы регистры а1, едх и ах процессо- 
ра. Регистр а1 содержит младшие 8 бит 32-разрядного регистра еах, а 4х — младшие 
16 бит 32-разрядного регистра еах. Эта последовательность инструкций загружает 
непосредственное значение @х378 в регистр еах, после чего считывает в регистр а1 
8-битное значение данных порта, номер которого содержится в 4х. 


Исходный код на языке С, позволяющий сгенерировать указанные выше инструк- 
ции на ассемблере: 


спаг 1прие_Буее; 
1приеЕ Буе = 1п6(0х378); 


Функцию 1п%, предназначенную для выполнения ввода 8-битного значения из порта 
ввода-вывода, предоставляет операционная система Глпих. Этот код будет функ- 
ционировать должным образом только в том случае, если он выполняется в этой 
операционной системе с повышенными привилегиями. Приложение, запущенное на 
уровне привилегий пользователя, при попытке выполнить эти инструкции потерпит 
неудачу, поскольку оно не имеет полномочий на выполнение операций ввода- 
вывода для порта напрямую. 


Инструкции для записи байта в регистр данных параллельного порта и тем самым 
установки состояния восьми дискретных выходных сигналов показаны в следую- 
щем фрагменте кода: 


тоу едх,0х378 
тоугх еах,ВУТЕ РТВ [г$р+@х7] 
ОчЕ 4х, а1 
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Этот код переносит в регистр еах номер порта, затем загружает в регистр еах пере- 
менную из стека. гзр — это 64-битный указатель стека. Значение гзр является 
64-битным, т. к. драйвер работает в 64-разрядной версии Глпих. Опкод поугх означа- 
ет "перемещение с дополнением нулями", т. е. эта инструкция перемещает 8-битное 
значение данных (с обозначением ВУТЕ РТВ), хранящееся по адресу гзр+9х7, в млад- 
шие 8 бит 32-битного регистра еах, заполняя 24 оставшихся бита в регистре еах ну- 
лями. Последняя инструкция записывает байт из регистра а1 по номеру порта, хра- 
нящемуся в регистре ах. 


Исходный код на языке С, генерирующий эти инструкции: 


спаг оифрие Буфе = @хАб; 
оиЕБ(оцери*_Бу%е,0х378); 


Аналогично 1п6, функция оси, предоставляемая ОС Глпих, позволяет драйверам 
устройств записывать 8-битные значения в заданный порт ввода-вывода. 


Этот пример демонстрирует механизм взаимодействия между программой, выпол- 
няемой процессором, и аппаратными регистрами периферийных устройств на са- 
мом низком уровне работы драйвера устройства. Драйверы для более сложных уст- 
ройств в системах х86 обычно сочетают метод ввода-вывода с распределением по 
портам, показанный в предыдущих примерах, с методом ввода-вывода с распреде- 
лением памяти, который обращается к интерфейсу устройства с помощью операций 
чтения и записи, с точки зрения инструкций процессора идентичных обращениям к 
памяти. 


В этих примерах представлены методы доступа к аппаратным средствам, исполь- 
зуемые драйверами в оригинальной архитектуре параллельной шины РСТ. В сле- 
дующем разделе рассматриваются функции, благодаря которым традиционные 
драйверы РСТ могут корректно работать на современных компьютерах с Р(Ше без 
изменений, в полной мере используя преимущества технологии высокоскоростной 
последовательной передачи данных РСТе. 


Драйверы устройств РСМе 


Как было показано в предыдущей главе, Ре использует высокоскоростные после- 
довательные соединения в качестве каналов связи между процессором и перифе- 
рийными устройствами с поддержкой РЦЩе. Возможно, вам интересно, какие дейст- 
вия должен выполнять драйвер устройства для взаимодействия с такими мощными 
аппаратными средствами. Простой ответ состоит в том, что драйверам не нужно 
делать ничего особенного, чтобы в полной мере воспользоваться широкими воз- 
можностями шины РСТе. Технология РСе была разработана с учетом требований 
программной совместимости с параллельной шиной РСТ, использовавшейся в ПК 
1990-х годов. Драйверы устройств, написанные для РС], по-прежнему корректно 
работают на компьютерах, использующих последовательную шину РСГе. Задача 
перевода инструкций ввода-вывода процессора, таких как 1п и оц, в операции по- 
следовательной передачи данных, которую необходимо решить для обмена данны- 
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ми с устройствами Ре, прозрачно выполняется подсистемами РСШе в процессоре, 
чипсете и устройствах с поддержкой РСТе. 


Устройства РСГ и РЦ автоматически выполняют операцию настройки во время 
запуска системы и при "горячем" подключении устройства к работающей системе. 
"Горячее" подключение — это установка аппаратного устройства в систему, ко- 
торая включена. 


После завершения настройки интерфейс устройства становится доступен операци- 
онной системе. Интерфейс между периферийным устройством РС или РСе и про- 
цессором может включать в себя любую комбинацию следующих механизмов об- 
мена данными: 


® ОДИН ИЛИ Несколько ДИапазонов портов ввода-вывода, 


® одна или несколько областей адресов памяти, поддерживающих ввод-вывод Сс 
распределением памяти, 


» подключение к обработчику прерываний процессора. 


Процедура настройки интерфейса применяется как к драйверам РСТ, так и к РЩМе, 
позволяя устаревшим драйверам РС] корректно работать в системах с РСТе. Конеч- 
но же, интерфейсы физических карт устройства с параллельной шиной РС] и уст- 
ройства с последовательной шиной Ре сильно различаются, поэтому сами карты 
не являются взаимозаменяемыми, т. к. используют шины на основе разных техно- 
логий. Разъемы шин РСе намеренно выполнены отличающимися от разъемов РСТ, 
чтобы предотвратить случайную установку устройств РС] в разъемы РСЕе, и наоборот. 


Массовая передача данных в периферийные устройства и из них обычно основана 
на технологии прямого доступа к памяти (д1гес{ тетогу ассез$, ОМА) — как для 
РСТ, так и для РСТе. В системах с поддержкой РСе операции ОМА в полной мере 
используют высокие скорости передачи данных, достижимые с помощью многоли- 
нейных последовательных соединений, передавая данные через интерфейс со ско- 
ростью, близкой к теоретической макс’'мальной скорости, которую может поддер- 
живать каждый одно- или многолинейный канал последовательной связи. 
Технологическое развитие, вызвавшее вытеснение устаревшей технологии парал- 
лельной шины РС]! значительно быстродействующей технологией многолинейной 
последовательной передачи данных Р(Це при сохранении полной совместимости с 
драйверами устройств, было весьма примечательным явлением. 


Структура драйверов устройств 


Драйвер устройства — это программный модуль, который реализует набор предо- 
пределенных функций, позволяющих операционной системе связывать драйвер с 
совместимыми периферийными устройствами и осуществлять контролируемый 
доступ к этим устройствам. Это дает возможность системным процессам и пользо- 
вательским приложениям выполнять операции ввода-вывода на совместно исполь- 
зуемых устройствах. 


В данном разделе представлен краткий обзор функций, которые должны быть реа- 
лизованы в драйвере устройства Глпих для использования разработчиками прило- 
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жений. В этом примере к именам функций в качестве префикса добавляется фик- 
тивное имя устройства туде\у1се. Пример написан на языке программирования С. 


Следующие функции выполняют инициализацию и завершение работы драйвера: 


11 тудеу1се_1т1{(\о1а); 
\014 мудеу1се_ех1*(\0194); 


Операционная система вызывает пудеу1се_1п1* для настройки драйвера устройства 
при запуске системы или позже, если устройство добавляется в систему посредст- 
вом "горячего" подключения. Функция пудеу1се_1п1& возвращает целочисленный 
код, указывающий, была ли инициализация успешной, или, в случае неудачи, код 
возникшей ошибки. На успешную инициализацию драйвера указывает возврат нуля. 


Когда драйвер больше не нужен, например при завершении работы системы, или 
когда устройство отсоединяют во время работы системы, система вызывает функ- 
цию тудеу1се_ех1*, чтобы полностью прекратить доступ к устройству и освободить 
все системные ресурсы, выделенные для драйвера. 


Следующие две функции позволяют системным процессам и пользовательским 
приложениям инициировать и завершать сеансы связи с устройством: 


1пе тудеу1се_ореп($Егисе 1поде *1по4е, $%гисЕ Пе *+11р); 
11Е тудем1се_ге1еазе($%гисЕ 1поде *1поде, $%гисе +11е *+11р); 


Функция тудеу1се_ореп пытается инициировать доступ к устройству и сообщает о 
любых ошибках, которые могут возникнуть при этом. Параметр 1поде — это указа- 
тель на структуру данных, содержащую информацию, необходимую для доступа к 
определенному файлу или другому устройству. Параметр +11р — это указатель на 
структуру данных, содержащую информацию об открытом файле. В подсистеме 
ввода-вывода [лпих все типы устройств последовательно представляются в виде 
файлов, даже если само устройство по своей сути не основано на файлах. Имя па- 
раметра +11р — это сокращение от #е ропиег (указатель файла). Все функции, ра- 
ботающие с данным файлом, получают указатель на эту структуру в качестве вход- 
ных данных. Среди прочих деталей структура +11р указывает, открыт ли файл для 
чтения, записи или для того и другого. 


Функция туде\1се_ге1еазе закрывает устройство или файл и освобождает все ресур- 
сы, выделенные при вызове функции туде\у1се_ореп. 


После успешного обращения к функции пудеу1се_ореп код приложения может на- 
чать считывание данных из устройства или запись в него. Функции, выполняющие 
эти операции: 


$5127е_+ тудеу1се геа4($%гисе Е11е *+1]р, сПаг *Би+, 
$12е_+ соипе, 10 + *+ роз); 

$$12е_* тудеу1се_мг1%е($%гис® +11е *+1]1р, соп$е сПаг *Би+, 
$12е_{ соипе, 104+ + *+ роз); 
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Функция тудеу1се_геад считывает данные из устройства или файла и передает их в 
буфер в пространстве памяти приложения. Параметр соипе указывает запрашивае- 
мый объем данных, а параметр + роз задает смещение от начала файла, с которого 
следует начать чтение данных. Параметр Би+ — это адрес места назначения данных. 
Количество фактически считанных байтов (которое может быть меньше запрошен- 
ного числа) предоставляется функцией в виде возвращаемого значения с типом 
данных $$127е_+. 


Функция тудеу1се_игМе использует большинство тех же параметров, что и 
тудеу1се_геад, за исключением того, что параметр Би объявляется константой 
(сопз+), т.к. функция тудеу1се_мг4+е считывает данные, начиная с адреса памяти, 
указанного параметром Би+, и записывает данные в файл или устройство. 


Один из интересных моментов в реализации этих функций заключается в том, что 
привилегированный код драйвера не может (или, по крайней мере, не должен, если 
операционная система разрешает это) напрямую обращаться к пользовательской 
памяти. Это сделано для предотвращения случайного или преднамеренного выпол- 
нения кодом драйвера считывания или записи в недопустимую область памяти, та- 
кую как пространство ядра. 


Для того чтобы избежать этой потенциальной проблемы, операционная система 
предоставляет специальные функции — сору_*0_изег и сору_#гот_изег, которые сле- 
дует использовать в драйверах для доступа к пользовательской памяти. Перед ко- 
пированием данных эти функции выполняют необходимые действия для проверки 
адресов пользовательского пространства, указанных в вызове функции. 


В этом разделе дано краткое введение в операции аппаратного интерфейса, выпол- 
няемые драйверами устройств, и представлена общая структура драйвера устройства. 


При включении компьютера перед загрузкой операционной системы и инициализа- 
цией ее драйверов для проведения низкоуровневого самотестирования и настройки 
системы необходимо запустить встроенное ПО. В следующем разделе представле- 
но введение в код, который выполняется при включении компьютера прежде дру- 
гих программ: базовая система ввода-вывода. 


Базовая система ввода-вывода (В1Ю5$) 


Базовая система ввода-вывода компьютера (Вазс шриу/Ошрие Зузет, ВО$) со- 
держит код, который выполняется при запуске системы. На заре появления персо- 
нальных компьютеров ВОЗ предоставляла собой набор программных интерфей- 
сов, которые помогали абстрагироваться от деталей интерфейсов периферийных 
устройств, таких как клавиатуры и дисплеи. 


В современных ПК во время запуска ВОЗ выполняет тестирование системы и на- 
стройку периферийных устройств. После завершения этих действий процессор (под 
управлением программ) взаимодействует с периферийными устройствами напря- 
мую, без дальнейшего вмешательства ВОЗ. 
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В ранних ПК код В1О$ хранился в чипе постоянной памяти (постоянном запоми- 
нающем устройстве, ПЗУ — геад-оту тетогу, КОМ) на материнской плате. Этот 
код был жестко запрограммирован и не мог быть изменен. Современные материн- 
ские платы обычно хранят В1О5 материнской платы в перепрограммируемом уст- 
ройстве флеш-памяти. Это позволяет устанавливать обновления ВОЗ для добавле- 
ния новых функций или устранения проблем, обнаруженных в более ранних 
версиях встроенного ПО. Процесс обновления содержимого ВОЗ обычно называ- 
ют перезаписью ВГО5. 


Один из недостатков перепрограммирования В1О$ заключается в том, что эта воз- 
можность позволяет внедрять в систему вредоносный код путем записи его во 
флеш-память В1О$. При успешной реализации атаки этого типа вредоносный код 
выполняется при каждом запуске компьютера. К счастью, успешные атаки на 
встроенное ПО ВЮ$ оказались довольно редкими. 


Поскольку ВОЗ берет на себя управление во время запуска системы, одним из 
первых ее действий является запуск самотестирования при включении питания 
(ро\ег-оп зе 1-е РОЗТ) для ключевых компонентов системы. Во время выполне- 
ния РОЗТ-процедуры В1О5 пытается взаимодействовать с системными компонен- 
тами, включая клавиатуру, дисплей и загрузочное устройство, в качестве которого 
обычно выступает дисковый накопитель. Компьютер может быть оснащен высоко- 
производительным графическим процессором, однако видеоинтерфейс, используе- 
мый ВОЗ во время запуска, может оказаться достаточно примитивным и поддер- 
живать лишь вывод текста. 


В1О$ использует видеоинтерфейс и интерфейс клавиатуры для отображения любых 
ошибок, обнаруженных во время тестирования системы, и позволяет пользователю 
изменять сохраненные настройки. Клавиатура и видеоинтерфейсы, предоставляе- 
мые В1О$, позволяют выполнить первоначальную настройку компьютера, в кото- 
ром еще нет загрузочного устройства. 


Если видеоинтерфейс работает неправильно, ВТО$ не сможет отобразить информа- 
цию, связанную с ошибкой. В этой ситуации В1О$ пытается использовать динамик 
ПК, при его наличии, чтобы указать на ошибку, выдавая последовательность звуко- 
вых сигналов. Документация по материнской плате содержит информацию о типах 
ошибок, на которые указывает каждая такая последовательность. Некоторые мате- 
ринские платы имеют цифровой дисплей для вывода сведений об ошибках в ходе 
тестов РОЗТ и другой информации о состоянии. 


В зависимости от конфигурации системы инициализацией устройств Ре во время 
запуска системы управляет либо В1О$, либо операционная система. После успеш- 
ного завершения процесса настройки всем устройствам РСе назначены совмести- 
мые диапазоны портов ввода-вывода, диапазоны ввода-вывода для режима с рас- 
пределением памяти и номера прерываний. 


По мере выполнения процедуры запуска операционная система определяет соот- 
ветствующий драйвер для связи с каждым периферийным устройством на основе 
информации о производителе и устройстве, предоставляемой периферийным уст- 
ройством через интерфейс РСГе. После успешной инициализации драйвер напря- 
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мую взаимодействует с каждым периферийным устройством для выполнения опе- 
раций ввода-вывода по запросу. Системные процессы и пользовательские прило- 
жения вызывают набор стандартизированных функций драйверов, представленных 
в предыдущем разделе, для получения доступа к устройству, выполнения операций 
чтения и записи и закрытия устройства. 


Одной из распространенных процедур, связанных с ВО$, которые выполняют 
пользователи, является выбор порядка загрузки среди доступных устройств хране- 
ния данных. Например, эта функция позволяет настроить систему на первую по- 
пытку загрузки с оптического диска, содержащего образ операционной системы, 
если такой диск находится в дисководе. Если загрузочный оптический диск не най- 
ден, система может попытаться загрузиться с основного дискового накопителя. Для 
загрузки операционной системы можно настроить и расположить в приоритетном 
порядке несколько устройств хранения данных. 


Для вызова режима настройки В1О$ иногда назначается определенная клавиша, 
например <Е$с> или функциональная клавиша <Е2>, которую следует нажать на 
ранней стадии процесса загрузки. Название соответствующей клавиши обычно 
отображается на экране вскоре после включения питания. При входе в режим на- 
стройки ВТО$ параметры отображаются в формате меню. Вы можете выбрать один 
из доступных экранов, чтобы изменить параметры, связанные с такими функциями, 
как порядок приоритетов загрузки. После внесения изменений в параметры пользо- 
вателю предоставляется возможность сохранить эти изменения в энергонезависи- 
мой памяти (попуо]ае тетогу, МУМ) и возобновить процесс загрузки. При этом 
следует соблюдать осторожность, поскольку внесение ненадлежащих изменений в 
настройки ВТО$ может привести к тому, что компьютер не загрузится. 


За время, прошедшее с момента появления 1ВМ РС, возможности реализаций ВОЗ 
значительно расширились. По мере развития архитектуры ПК и добавления под- 
держки 32-разрядных, а затем и 64-разрядных операционных систем устаревшая 
архитектура В1О$ не поспевала за потребностями новых, более удобных систем. 
Крупные участники отрасли выступили с инициативой определить архитектуру 
встроенного программного обеспечения системы, которая помогла бы избавиться 
от ограничений ВТО$З. Результатом этих усилий стал стандарт ОЕЕ1, который заме- 
нил традиционные возможности В1О$ в современных материнских платах. 


Единый расширяемый интерфейс встроенного ПО (ЧЕР!) 


Единый расширяемый интерфейс встроенного ПО (Ошбед Ежепз Ые Еити\уаге 
Нце! асе, ОЕЕГ) — это выпущенный в 2007 г. стандарт, определяющий архитектуру 
встроенного ПО, которое реализует функции, предоставляемые устаревшим ВОЗ, 
и добавляет ряд существенных улучшений. Как и в случае с ВОЗ, ОЧЕЕ содержит 
код, выполняемый сразу после запуска системы. 


Введение ОЕЕ! преследует несколько целей, включая добавление поддержки загру- 
зочных дисковых накопителей объемом более 2 терабайт (Тбайт), сокращение 
времени запуска и повышение безопасности процесса загрузки. ОЕЕТ предоставля- 
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ет несколько функций, которые при включении и правильном использовании суще- 
ственно снижают вероятность случайного или злонамеренного повреждения встро- 
енного ПО, хранящегося во флеш-памяти ОЕЕ|. 


В дополнение к возможностям устаревших реализаций ВОЗ, описанных ранее, 
ЧЕЕ поддерживает следующие функции. 


Приложения ОЕЕТ — это модули исполняемого кода, хранящиеся во флеш- 
памяти ОЕЕГ. Приложения (ЕЕ! расширяют спектр возможностей, доступ- 
ных в предзагрузочной среде материнской платы, и, в некоторых случаях, 
предоставляют сервисы для использования операционными системами во 
время выполнения. Одним из примеров приложений ОЕЁЕ! является оболочка 
ЧЕЕГ которая представляет собой интерфейс командной строки для взаимо- 
действия с процессором и периферийными устройствами. Оболочка ЦЕЕ 
поддерживает запросы данных от устройств и позволяет изменять параметры 
конфигурации, хранящиеся в энергонезависимой памяти. 


Другим примером приложения ЦЧЕЕ![ является СМИ СВапд Оп@ед ВооПоадег 
(СВОВ). СКОВ поддерживает многозагрузочные конфигурации, представляя 
меню, из которого пользователь может выбрать один из нескольких доступ- 
ных образов операционной системы для загрузки в ходе запуска системы. 


Архитектурно-независимые драйверы устройств предоставляют ЧЕЕ[ 
доступ к независимым от процессора реализациям драйверов устройств. Бла- 
годаря этому можно использовать единую реализацию встроенного ПО ОЕЕ! 
на таких разноплановых архитектурах, как х86 и процессоры Адуапсеа В1$С 
МасНнше (АВМ). Архитектурно независимые драйверы ОЕЁЕ хранятся в фор- 
мате байтового кода, который интерпретируется встроенным ПО, соответст- 
вующим типу процессора. В ходе загрузки эти драйверы обеспечивают взаи- 
модействие ЧЕЕГ с периферийными устройствами, такими как графические 
карты и сетевые интерфейсы. 


Безопасная загрузка — использование криптографических сертификатов, 
гарантирующих, что во время запуска системы выполняются только одоб- 
ренные драйверы устройств и загрузчики операционной системы. Эта функ- 
ция проверяет цифровую подпись каждого компонента встроенного ПО, 
прежде чем разрешить его выполнение. Такая проверка защищает от разно- 
образных вредоносных атак, нацеленных на встроенное ПО. 


Ускорение загрузки достигается за счет параллельного выполнения опера- 
ций, которые в ВОЗ выполнялись последовательно. На практике загрузка 
происходит настолько быстро, что многие реализации ОЕЕТ не предлагают 
пользователю возможность нажимать клавишу во время загрузки, поскольку 
ожидание ответа ведет к задержке запуска системы. Вместо этого операцион- 
ные системы, такие как \/тдо\з, обеспечивают доступ к настройкам ЧЕЕП, 
предлагая пользователю возможность запрашивать этот доступ во время ра- 
боты операционной системы с последующей перезагрузкой для отображения 
экрана настройки ЦЕРН. 
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ЧЕЕГ не просто заменяет функции старого ВО$. Это миниатюрная операционная 
система, поддерживающая расширенные возможности, например позволяющая 
удаленному специалисту использовать сетевое подключение для устранения непо- 
ладок на компьютере, который не загружается. 


После тестов РОЗТ, низкоуровневой настройки системных устройств и определе- 
ния соответствующего загрузочного устройства на основе порядка выполнения за- 
грузки система начинает процесс загрузки операционной системы. 


Процесс загрузки операционной системы 


Процедура загрузки образа системы зависит от структуры (формата) разделов на 
устройстве хранения данных, где записан этот образ, и функций безопасности, 
применяемых во время загрузки. Цель процесса загрузки — запустить систему по- 
сле включения питания и инициализировать операционную систему, оставив ком- 
пьютер в известном состоянии и готовым к выполнению полезной работы. 


С начала 1980-х годов стандартный формат разделов диска назывался основной 
загрузочной записью (таз{ег Боо{ гесог4, МВЮ). Раздел МВЕЁ имеет загрузочный 
сектор, расположенный в логическом начале отведенного для него пространства. 
Этот загрузочный сектор содержит информацию, описывающую логические разде- 
лы устройства. Каждый раздел содержит файловую систему, организованную в ви- 
де древовидной структуры каталогов и файлов внутри них. 


Из-за фиксированного формата структур данных МВЁ запоминающее устройство 
МВК может содержать максимум четыре логических раздела и иметь объем не бо- 
лее 2 Тбайт, т. е. 2? 512-байтовых секторов для размещения данных. Эти ограниче- 
ния стали весьма ощутимыми, когда объем доступных на рынке дисковых накопи- 
телей пересек границу в 2 Тбайт. Для решения этих проблем и параллельно с 
разработкой ОЕЕГ был разработан новый формат разделов — таблица разделов 
СО (СОШ Рагавоп ТаЫе, СРТ), где СОТ означает глобальный уникальный 
идентификатор (С]офа! От1аие Шепийег). Этот формат устранил ограничения в 
отношении объема накопителя и количества разделов, предоставив при этом неко- 
торые дополнительные усовершенствования. 


Накопитель, размеченный по формату СОРТ, имеет максимальный размер 254 
512-байтовых секторов, вмещающих более 8 млрд терабайт данных. При обычной 
настройке ОРТ поддерживает до 128 разделов на накопитель. Тип каждого раздела 
указывается 128-битным идентификатором СОТО, что позволяет в будущем опре- 
делять фактически неограниченное количество новых типов разделов. Большинст- 
ву пользователей не требуется большое количество разделов на одном накопителе, 
поэтому наиболее очевидным преимуществом СОРТ для пользователей является 
поддержка накопителей большего объема. 


Процесс загрузки для материнских плат с ВТОЗ и с ОЕЕ[ имеет некоторые отличия, 
описанные в следующих разделах. 
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Загрузка при использовании ВЮ5$ 


На материнской плате с ВТОЗ после тестов РОЗТ и настройки устройств РСе ВОЗ 
инициирует процесс загрузки. ВОЗ предпринимает попытку выполнить загрузку с 
первого устройства в настроенной последовательности приоритетов. Если обнару- 
жено допустимое устройство, встроенное ПО считывает из загрузочного сектора 
МВК небольшой фрагмент исполняемого кода, называемый загрузчиком, и переда- 
ет ему управление. На этом встроенное ПО ВОЗ завершает свою работу и больше 
не используется во время функционирования системы. Загрузчик инициирует про- 
цесс загрузки и запуска операционной системы. 


Если на материнской плате с ВОЗ используется диспетчер загрузки, код загрузоч- 
ного сектора МВК запускает этот диспетчер вместо непосредственного выполнения 
загрузки операционной системы. Диспетчер загрузки (например, СКОВ) отобража- 
ет список, из которого пользователь выбирает требуемый образ операционной сис- 
темы. Встроенное ПО ВОЗ не располагает информацией о многозагрузочных кон- 
фигурациях, и процесс выбора операционной системы в диспетчере загрузки 
происходит без участия В1ОЗ. 


МНОГОЗАГРУЗОЧНАЯ КОНФИГУРАЦИЯ И ПРИОРИТЕТЫ 
ЗАГРУЗКИ 


/ Многозагрузочная конфигурация в диспетчере загрузки позволяет 
7 пользователю выбрать нужную операционную систему из меню дос- 


тупных вариантов. Это меню отличается от приоритетного списка вари- 
антов загрузки, поддерживаемого ВТО$, который позволяет самой ВОЗ 
выбирать первый доступный образ операционной системы. 


Загрузка при использовании ЦЕЕ! 


На материнской плате с ОЕРТГ после завершения тестов РОЗТ и настройки уст- 
ройств (способом, очень похожим на соответствующие действия В1О$) ОЕЕ ини- 
циирует процесс загрузки. В ходе процедуры запуска может отображаться диспет- 
чер загрузки. Диспетчер загрузки ЧЕН, являющийся частью встроенного ПО ОЕЁГ, 
отображает меню, из которого пользователь может выбрать требуемый образ опе- 
рационной системы. 


Если пользователь не выбирает операционную систему из меню диспетчера загруз- 
ки в течение нескольких секунд (или если меню диспетчера загрузки не отобража- 
ется), ОЕЕТ пытается выполнить загрузку с первого устройства в настроенной по- 
следовательности приоритетов. 


Встроенное ПО ЧЕЕГ считывает исполняемый код диспетчера загрузки (который 
существует отдельно от диспетчера загрузки ЧЕЕГ) и файлы загрузчика из настро- 
енных расположений на системном диске, затем выполняет эти файлы в процессе 
запуска. 
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На следующей копии экрана показана часть системных данных конфигурации 
загрузки (600+ сопНгиганоп даа, ВСО), хранящихся в системе У/тдо\из 10. Для 
отображения этой информации на своем компьютере вам следует ввести команду 
Ьсдеа1+, используя интерфейс командной строки с правами администратора. 


С: \>Бсаеа1+ 
и1п4ом5 Вооф Мапавег 
1аеп{11ег {Боо{тег} 


деу1се рагЕ11оп=\Веу1се\Нагаа91$К\Уо]ите1 рафп \ЕРТ\МТСКО$ОРТ\ВООТ\ВООТМСЕИ. ЕЕТ 


и1идом$ Воое 1оааег 


1деп{11ег {сиггеп} деу1се рагЕ11оп=С: 


рафи \\ТМООМ$ \5у$фетЗ2\млп]оа4.е+1 


В этом примере диспетчер загрузки \УШдо\$ находится в файле 
\ЕЕРТ\МТСВО$ОЕТ\ВООТ\ВООТМбЕИ. ЕЕТ. Этот файл обычно хранится в скрытом разделе дис- 
ка и не всегда доступен для отображения в списках каталогов. 


Загрузчик У/т4о\$ идентифицируется как \МТМОО$\зузетз2\м1п1оа4.е+1 и распо- 
ложен в каталоге С: \И1пдом$\$у5ет32\м1п1оа4.е+1. 


Вероятность злонамеренной модификации встроенного ПО ЧЕЕГ или хранящихся 
на диске программных компонентов, выполняемых во время загрузки системы, 
требует дополнительной защиты, обеспечиваемой процессом доверенной загрузки. 


Доверенная загрузка 


Целью процесса доверенной загрузки является выполнение всей последовательно- 
сти загрузки с гарантией, что все выполняемое программное обеспечение должным 
образом авторизовано и не было изменено. Загрузочное ПО проверяет подлинность 
встроенного ПО и файлов программ, вычисляя криптографическую хеш-функцию 
последовательности байтов, составляющих каждый программный компонент, 
и подтверждая правильность итогового значения хеш-функции с помощью цифро- 
вой подписи. 


Криптографическая хеш-функция генерирует "отпечаток пальца" для блока дан- 
ных произвольной длины. Выходное значение, получаемое с помощью данной 
криптографической хеш-функции, всегда имеет одну и ту же длину. Например, 
256-битный алгоритм безопасного хеширования Зесиге Назвшр А!оогийт 
(ЗНА-256) всегда выдает 256-битный результат независимо от длины входных данных. 


Криптографическая хеш-функция обеспечивает безопасность благодаря тому, что 
любая попытка изменить данные, используемые этой функцией в качестве входных 
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данных, приведет к тому, что выходные данные хеш-функции также изменятся. 
Определить набор модификаций блока входных данных, при которых хеш-функция 
будет выдавать тот же результат, что и при расчете по исходному блоку данных, 
фактически нереально. В теории можно создать модифицированный набор данных, 
для которого алгоритм ЗНА-256 будет выдавать тот же результат, что и исходный 
блок, однако необходимые для этого вычисления на самом быстром доступном на 
сегодняшний день суперкомпьютере заняли бы больше времени, чем оставшийся 
срок существования Земли. Мы обсудим хеш-функции более подробно в главе 15. 


Для того чтобы создать цифровую подпись, издатель программного обеспечения 
должен вычислить значение хеш-функции для хранящегося в памяти образа встро- 
енного ПО или программного компонента. Следующий шаг — зашифровать хеш- 
значение с помощью закрытого ключа. Этот закрытый ключ шифрования связан с 
общедоступным ключом расшифровки. Зашифрованное хеш-значение формирует 
цифровую подпись, которая сохраняется вместе с файлом встроенного ПО или про- 
граммного компонента. 


Открытый ключ становится доступным для пользователей встроенного ПО или 
программного компонента. Этот ключ используется для расшифровки зашифро- 
ванного хеш-значения, которое затем можно сравнить с хеш-значением, вычислен- 
ным на основе последовательности байтов данных файла во время загрузки. Эти 
два хеш-значения должны в точности совпадать, что подтвердит факт неизменно- 
сти файла с момента его подписания цифровой подписью. Как и в случае с крипто- 
графическим алгоритмом хеширования, фактически невозможно изменить цифро- 
вую подпись таким образом, чтобы скрыть изменения в защищенном файле 
данных. 


Открытый ключ не требуется хранить в тайне, однако пользователи этого ключа 
должны убедиться, что сам ключ получен из надежного источника и не был заме- 
нен злоумышленником. Для того чтобы гарантировать, что в процессе загрузки ис- 
пользуются только доверенные открытые ключи, эти ключи хранятся в аппаратном 
хранилище, недоступном для неавторизованных пользователей и программного 
обеспечения. Стандартный механизм для этого в ПК называется доверенным 
платформенным модулем (фазе р|аМогт тодше, ТРМ). По сути, ТРМ — это 
микроконтроллер, разработанный специально для защиты криптографических ключей. 


На новых компьютерах ключи ТРМ настраиваются изготовителем системы для 
обеспечения безопасной загрузки системы с момента ее первоначального включения. 


В отличие от персональных компьютеров, большинство мобильных устройств ис- 
пользуют гораздо более простой процесс загрузки, который не задействует ВОЗ 
или ОЕЕ1. В следующем разделе рассматривается процесс загрузки мобильных уст- 
ройств. 


Мобильные устройства 


Большинство мобильных устройств, таких как смартфоны, обычно не имеют от- 
дельного встроенного загрузочного ПО, подобного ВОЗ или ОЕ в ПК. Как мы 
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видели на примере 6502, при подаче питания такие устройства выполняют аппа- 
ратный сброс процессора и начинают выполнение кода по указанному адресу. Весь 
код в этих устройствах обычно находится в энергонезависимой области памяти, 
такой как флеш-память. 


Во время запуска мобильные устройства выполняют последовательность, анало- 
гичную процессу загрузки ПК. Проверка правильности работы и инициализация 
периферийных устройств проводятся перед их первым использованием. Загрузчику 
на таких устройствах может потребоваться выбрать один из нескольких разделов 
памяти, чтобы определить подходящий образ системы. Как и в случае с ЧЕН, мо- 
бильные устройства часто задействуют функции безопасности во время процесса 
загрузки с целью убедиться, что загрузчик и образ операционной системы являются 
подлинными, прежде чем разрешить продолжение процесса загрузки. 


Как на ПК, так и в мобильных устройствах запуск загрузчика является первым ша- 
гом процедуры запуска операционной системы. Далее мы рассмотрим запуск опе- 
рационной системы. 


Операционные системы 


Операционная система — это многоуровневый пакет программного обеспечения, 
обеспечивающий создание среды, в которой приложения выполняют полезные 
функции, такие как обработка текстов, выполнение телефонных вызовов или 
управление работой автомобильного двигателя. Приложения, работающие под 
управлением операционной системы, выполняют алгоритмы, реализованные в виде 
последовательностей инструкций процессора, и по мере необходимости обменива- 
ются данными с периферийными устройствами с помощью операций ввода-вывода 
для выполнения своих задач. 


Операционная система предоставляет стандартизированные программные интер- 
фейсы, которые разработчики приложений используют для доступа к системным 
ресурсам, таким как потоки выполнения процессора, файлы на диске, ввод с кла- 
виатуры или других периферийных устройств и вывод на такие устройства, как эк- 
ран компьютера или приборы на приборной панели автомобиля. 


Операционные системы можно разделить на две широкие категории — работаю- 
щие в реальном времени и работающие не в реальном времени: 


е Операционная система реального времени (геа1-ите орегайпр зузет, 
КТО5) предоставляет функции, гарантирующие, что реакция на входные воз- 
действия последует в течение определенного времени. 


Процессоры, решающие такие задачи, как управление работой автомобиль- 
ного двигателя или кухонного прибора, обычно работают под управлением 
операционной системы реального времени. Это служит гарантией того, что 
электрические и механические компоненты, которыми они управляют, полу- 
чают отклики на любые изменения входных воздействий в течение строго 
ограниченного времени. 
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» Операционные системы, работающие не в реальном времени, не гаранти- 
руют получения ответа на входные воздействия в заданные сроки. Вместо 
этого такие системы пытаются выполнить обработку как можно быстрее, да- 
же если иногда для завершения работы требуется много времени. 


ОПЕРАЦИОННЫЕ СИСТЕМЫ РЕАЛЬНОГО ВРЕМЕНИ 
В СРАВНЕНИИ С ОБЫЧНЫМИ ОПЕРАЦИОННЫМИ 
СИСТЕМАМИ 


Операционные системы реального времени (ОСРВ) не обязательно яв- 
и ляются более быстрыми, чем обычные операционные системы, рабо- 
\\ => тающие не в реальном времени. Обычная операционная система может 
быть в среднем быстрее по сравнению с ОСРВ, но при этом такая сис- 
тема может иногда превышать временные ограничения, установленные 
для приложений, выполняющихся в ОСРВ. Цель ОСРВ — никогда не 
превышать предельное время отклика. 


По большей части операционные системы общего назначения, такие как Глпих и 
\Упдо\з, не являются операционными системами реального времени. Они стара- 
ются выполнить назначенные задачи, вроде загрузки файла в текстовый редактор 
или вычисления электронной таблицы, как можно быстрее, хотя время выполнения 
операции может сильно меняться в зависимости от других задач, которые может 
выполнять система. 


Некоторые аспекты операционных систем общего назначения, в частности вывод 
аудио- и видеосигналов, предъявляют особые требования к работе в реальном вре- 
мени. Мы все в тот или иной момент наблюдали сбои в воспроизведении видео, 
при котором изображение на экране прерывается и подвисает. Такой эффект явля- 
ется результатом невыполнения требований дисплея к пропускной способности в 
реальном времени. Сотовые телефоны предъявляют аналогичные требования к 
поддержке двустороннего обмена аудиоданными в реальном времени в ходе теле- 
фонных вызовов. 


Как на стандартных ПК, так и на мобильных устройствах, запуск операционной 
системы (обычной или работающей в реальном времени), как правило, выполняет- 
ся с использованием аналогичной последовательности шагов. Загрузчик либо за- 
гружает ядро операционной системы в память, либо просто переходит по адресу в 
виртуальной памяти, чтобы начать выполнение кода операционной системы. 


После запуска ядро операционной системы выполняет следующие действия (хотя и 
не обязательно в указанном порядке). 


» Настройка конфигурации процессора и других системных устройств. Сюда 
относится настройка любых необходимых внутренних регистров процессора 
и любых связанных с ними устройств управления вводом-выводом, таких как 
чипсет. 
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» В системах, использующих виртуальную память со страничной организацией 
(которая будет представлена в главе 7), ядро настраивает модуль управления 
памятью. 


» Запуск системных процессов базового уровня, включая планировщик и 
процесс простоя. Планировщик управляет последовательностью выполнения 
потоков процессов. Процесс простоя содержит код, который выполняется, 
когда нет других потоков, готовых к запуску планировщиком. 


»® Составление перечня драйверов устройств и их привязка к каждому перифе- 
рийному устройству в системе. Для каждого драйвера выполняется код ини- 
циализации, как обсуждалось ранее в этой главе. 


® Настройка и включение прерываний. После включения прерываний система 
начинает выполнять операции ввода-вывода с периферийными устройствами. 


» Запуск системных сервисов. Эти процессы поддерживают действия, не свя- 
занные с операционной системой (например, работу с сетями), а также посто- 
янно действующие установленные функции (например, веб-сервер). 


» Для персональных компьютеров запускается процесс пользовательского ин- 
терфейса, который отображает экран входа в систему. Этот экран дает поль- 
зователю возможность инициировать интерактивный сеанс работы с компью- 
тером. На мобильных устройствах запускается приложение реального 
времени. Базовая последовательность операций для простого встроенного 
приложения заключается в считывании входных данных с устройств ввода- 
вывода, выполнении вычислительного алгоритма для формирования выход- 
ных данных и записи этих выходных данных в устройства ввода-вывода с по- 
вторением этой процедуры через фиксированные интервалы времени. 


В этом разделе термин "процесс" используется для обозначения программы, вы- 
полняемой процессором. Термин "поток" обозначает поток выполнения в пределах 
процесса, которых может быть несколько. В следующем разделе эти темы рассмат- 
риваются более подробно. 


Процессы и потоки 


Многие (но не все) операционные системы поддерживают концепцию многопоточ- 
ного выполнения. Поток — это последовательность программных инструкций, ко- 
торая выполняется логически изолированно от других потоков. Операционная сис- 
тема, работающая на одноядерном процессоре, создает иллюзию одновременного 
выполнения нескольких потоков за счет разделения по времени. 


При разделении по времени планировщик операционной системы предоставляет 
каждому готовому к запуску потоку период времени для выполнения. Когда интер- 
вал выполнения потока заканчивается, планировщик прерывает запущенный поток 
и продолжает выполнение следующего потока из своей очереди. Таким образом, 
планировщик дает каждому потоку немного времени для выполнения, прежде чем 
вернуться к началу списка и начать цикл заново. 
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В операционных системах, способных поддерживать несколько выполняемых про- 
грамм одновременно, термин "процесс" относится к запущенному экземпляру ком- 
пьютерной программы. Для каждого процесса система выделяет ресурсы, такие как 
память и место в очереди готовых к выполнению потоков планировщика. 


При запуске на выполнение процесс состоит из одного потока. По мере выполнения 
процесс может создавать больше потоков. 


Программисты создают многопоточные приложения по разным причинам, включая 
следующие. 


Один поток может выполнять ввод-вывод, в то время как другой поток вы- 
полняет основной алгоритм программы. Например, основной поток может 
периодически обновлять выводимую на пользовательский дисплей информа- 
цию, в то время как другой поток ожидает пользовательского ввода с клавиа- 
туры, находясь в заблокированном состоянии. 


Приложения со значительными требованиями к вычислительным ресурсам 
могут использовать преимущества многопроцессорных и многоядерных ком- 
пьютерных архитектур, разделяя большие вычислительные задания на груп- 
пы более мелких задач, которые можно выполнять параллельно. Выполняя 
каждую из этих небольших задач в отдельном потоке, программы дают пла- 
нировщику возможность назначать разные потоки для одновременного вы- 
полнения на нескольких ядрах. 


В течение своего жизненного цикла процесс проходит через ряд состояний. Вот 
некоторые состояния процесса, назначаемые операционными системами. 


Инициализация: при первом запуске процесса (возможно, двойным щелч- 
ком пользователя по значку на рабочем столе) операционная система начина- 
ет загружать код программы в память и назначать системные ресурсы для его 
использования. 


Ожидание: после завершения инициализации процесса он готов к запуску. 
На этом этапе его поток помещается в очередь готовых к выполнению пото- 
ков планировщика. Процесс остается в состоянии ожидания до тех пор, пока 
планировщик не разрешит ему начать выполнение. 


Выполнение: поток выполняет программные инструкции, содержащиеся в 
его разделе кода. 


Блокировка: поток переходит в это состояние, когда запрашивает ввод- 
вывод с устройства, что приводит к приостановке выполнения. Например, 
блокировку обычно вызывает чтение данных из файла. В заблокированном 
состоянии поток ожидает завершения обработки запроса драйвером устрой- 
ства. Как только работающий поток переходит в состояние блокировки, пла- 
нировщик может переключиться на другой готовый к выполнению поток, по- 
ка выполняется операция ввода-вывода первого потока. Когда эта операция 
завершается, заблокированный поток возвращается в состояние ожидания в 
очереди планировщика и рано или поздно переходит в состояние выполне- 
ния, после чего обрабатывает результаты операции ввода-вывода. 
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Время выполнения для готовых к запуску процессов распределяет планировщик. 
Процесс планировщика отвечает за предоставление времени выполнения всем сис- 
темным и пользовательским потокам. 


Планировщик — это управляемая прерываниями процедура, которая выполняется в 
периодические интервалы времени, а также в ответ на действия потоков, такие как 
инициирование операций ввода-вывода. Во время инициализации операционной 
системы к обработчику прерываний планировщика подключается периодический 
таймер и запускается таймер планировщика. 


Пока каждый процесс находится в состоянии инициализации, ядро добавляет в 
свой список запущенных процессов структуру данных, называемую блоком 
управления процессом (ргосез$ сопго! Моск, РСВ). Этот блок содержит информа- 
цию, необходимую системе для обслуживания процесса и взаимодействия с ним в 
течение всего его жизненного цикла, включая сведения о выделении памяти и о 
файле, содержащем исполняемый код процесса. В большинстве операционных сис- 
тем для идентификации процесса используется целое число, которое остается уни- 
кальным в течение всего его жизненного цикла. 


В У\Упдо\з инструмент Везоигсе Мопйог (Монитор ресурсов) (этот инструмент 
можно запустить, набрав Везоигсе Моп1хог (Монитор ресурсов) в поле поиска 
У/тп4до\$ и щелкнув по результату с обозначением Везоигсе Мопйог (Монитор ре- 
сурсов)) отображает информацию о запущенных процессах, включая идентифика- 
тор процесса (Ргосез$ ТРепийег, РГО), назначенный каждому процессу. В Тлпих ко- 
манда +ор отображает процессы, потребляющие наибольшее количество системных 
ресурсов, идентифицируя каждый из них по его идентификатору РГО. 


Планировщик хранит информацию, связанную с каждым потоком, в блоке управ- 
ления потоком (Шгеа4 сопёго] Моск, ТСВ). У каждого процесса есть список связан- 
ных ТСВ, который содержит минимум одну запись. ТСВ хранит информацию, от- 
носящуюся к потоку, такую как контекст процессора. Это набор данных, которые 
ядро использует для возобновления выполнения ожидающего или заблокированно- 
го потока. Этот набор состоит из следующих элементов: 


® сохраненные регистры процессора; 
® указатель стека; 

» регистр флагов; 

» указатель инструкций. 


По аналогии с РО каждый поток имеет идентификатор потока (®геад 14епийег, 
ТО), представленный целым числом и являющийся уникальным в течение своего 
жизненного цикла. 


Планировщик использует один или несколько алгоритмов планирования для рав- 
номерного распределения времени выполнения между системными и пользователь- 
скими процессами. С первых дней существования вычислительной техники широко 
используются две основные категории алгоритмов планирования потоков — невы- 
тесняющие и вытесняющие: 


е невытесняющие алгоритмы предоставляют потоку ПОЛНЫЙ контроль над 
выполнением, позволяя ему выполняться до тех пор, пока он не завершится 
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или пока он сам не передаст управление планировщику, чтобы другие потоки 
получили возможность выполнения; 


е При использовании вытесняющих алгоритмов планировщик имеет право 
остановить запущенный поток и передать управление выполнения другому 
потоку без подтверждения со стороны первого потока. 


Когда вытесняющий планировщик переключает выполнение с одного потока на 
другой, он совершает следующие действия: 


1. Происходит прерывание по таймеру, которое заставляет планировщик начать 
выполнение, либо запущенный поток выполняет действие, вызывающее его 
блокировку, например инициирует операцию ввода-вывода. 


2. Планировщик копирует регистры процессора снимаемого потока в контекстные 
поля блока управления этим потоком (ТСВ). 


3. Планировщик просматривает свой список готовых к выполнению потоков и 
определяет, какой поток следует перевести в состояние выполнения. 


4. Планировщик загружает контекст входящего потока в регистры процессора. 


5. Планировщик возобновляет выполнение входящего потока, переходя к инст- 
рукции, на которую указывает программный счетчик потока. 


Планирование потоков происходит с высокой частотой — это означает, что код, 
определяющий работу планировщика, должен быть максимально эффективным. 
В частности, сохранение и извлечение контекста процессора занимает некоторое 
время, поэтому разработчики операционных систем прилагают все усилия для 
оптимизации кода переключения контекста планировщика. 


В любой момент времени в очереди может быть множество процессов, претен- 
дующих на выполнение, поэтому планировщик должен гарантировать, что крити- 
ческие системные процессы будут выполняться с требуемыми интервалами. В то 
же время, с точки зрения пользователя, приложения должны демонстрировать дос- 
таточно быструю реакцию на вводимые пользователем данные, обеспечивая при 
этом приемлемый уровень производительности при выполнении длительных вы- 
числений. 


Для эффективного управления этими противоречивыми требованиями на протяже- 
нии многих лет были разработаны различные алгоритмы. Основной особенностью 
большинства алгоритмов планирования потоков является использование приорите- 
тов процессов. В следующем разделе представлены несколько алгоритмов плани- 
рования потоков на основе приоритетов. 


Алгоритмы планирования и приоритет процесса 


Операционные системы, поддерживающие несколько процессов, обычно предос- 
тавляют механизм приоритизации, благодаря которому наиболее важные систем- 
ные функции получают достаточное время обработки, даже когда система работает 
с большой нагрузкой, и при этом выделяется достаточное время для выполнения 
пользовательских процессов с более низким приоритетом. Для различных типов 
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операционных систем было разработано несколько алгоритмов, преследующих 
различные цели в области производительности. Вот некоторые алгоритмы плани- 
рования, которые были популярны на протяжении многих лет, начиная с самых 
простых. 


Первым пришел, первым обслужен (Вг5{ соте, Ягз( зегуе4а, ЕСЕЗ). Этот не- 
вытесняющий алгоритм был распространен в устаревших операционных сис- 
темах с пакетной обработкой. В алгоритме планирования ЕСЕ$ каждому про- 
цессу предоставляется контроль над выполнением, и он сохраняет этот 
контроль до тех пор, пока выполнение не будет завершено. Приоритизация 
процессов отсутствует, и время завершения любого процесса зависит от вре- 
мени выполнения процессов, предшествующих ему во входной очереди. 


Кооперативная многопоточность. В ранних версиях \У/тдо\з и тасОЗ ис- 
пользовалась невытесняющая архитектура многопоточности, которая полага- 
лась на допущение, что каждый поток сам передает управление операцион- 
ной системе через достаточно частые промежутки времени. При этом от 
разработчиков приложений требовались значительные усилия, чтобы одно 
приложение не лишало другие приложения возможности выполнения из-за 
неспособности передать управление через соответствующие промежутки 
времени. Каждый раз, когда операционная система получала управление, она 
выбирала следующий поток для выполнения из приоритизированного списка 
готовых к выполнению потоков. 


Циклическое планирование. Вытесняющий циклический планировщик ве- 
дет список готовых к выполнению потоков и предоставляет каждому из них 
интервал выполнения по очереди, возвращаясь в начало списка при достиже- 
нии его конца. Этот подход фактически устанавливает равные приоритеты 
для всех процессов, предоставляя каждому из них возможность выполнения в 
течение определенных периодов времени с интервалами, зависящими от ко- 
личества процессов в списке планировщика. 


Планирование с вытеснением и фиксированным приоритетом. В данном 
алгоритме каждому потоку присваивается приоритет, указывающий на важ- 
ность передачи этому потоку управления выполнением, когда он находится в 
состоянии ожидания. Когда поток, имеющий более высокий приоритет, чем 
текущий запущенный поток, переходит в состояние ожидания, планировщик 
немедленно останавливает запущенный поток и передает управление входя- 
щему потоку. Планировщик ведет список ожидающих процессов в порядке 
приоритета, помещая потоки с наивысшим приоритетом в начало очереди. 
Применение этого алгоритма может привести к тому, что потоки с более низ- 
ким приоритетом не смогут получить какое-либо время для выполнения, если 
потоки с более высоким приоритетом монополизируют доступное время вы- 
полнения. 


Частотно-монотонное планирование (гае-топоютшс зсВедийп?, КМУ) — 
это вытесняющий алгоритм с фиксированным приоритетом, обычно исполь- 
зуемый в системах реального времени с жесткими сроками завершения (же- 
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сткий срок завершения — это срок, который нельзя пропустить). При исполь- 
зовании этого алгоритма потокам, которые выполняются чаще, назначаются 
более высокие приоритеты. Пока выполняются несколько критериев (интер- 
вал выполнения потока равен сроку завершения, взаимодействия между по- 
токами, вызывающие задержку, невозможны, а время переключения контек- 
ста незначительно), и если максимально возможное время выполнения 
каждого потока меньше математически рассчитанного предела, сроки завер- 
шения гарантированно будут соблюдены. 


» Справедливое планирование —это планирование, направленное на макси- 
мальное использование процессорного времени с гарантией того, что каждо- 
му пользователю предоставляется равное количество времени выполнения. 
Вместо назначения потокам числовых приоритетов фактический приоритет 
каждого потока определяется количеством времени выполнения, которое он 
потребил. По мере того как поток использует все больше и больше процес- 
сорного времени, его приоритет снижается, предоставляя другим потокам 
больше возможностей для запуска. Преимущество такого подхода заключа- 
ется в том, что для интерактивных пользователей, которые не потребляют 
значительного времени выполнения, быстродействие системы повышается. 
Ядро Глпих использует алгоритм справедливого планирования в качестве 
планировщика по умолчанию. 


» Многоуровневая очередь с обратной связью. Этот алгоритм использует не- 
сколько очередей, каждая из которых имеет разный уровень приоритета. Но- 
вые потоки добавляются в конец очереди с наивысшим приоритетом. В каж- 
дом интервале планирования планировщик предоставляет возможность 
выполнения потоку, стоящему в начале очереди.с высоким приоритетом, 
и удаляет этот поток из очереди, приближая время выполнения остальных 
потоков. Со временем вновь созданный поток получает возможность выпол- 
нения. Если поток потребляет все предоставленное ему время выполнения, он 
вытесняется по завершении своего интервала и добавляется в конец следую- 
щей очереди с более низким приоритетом. Планировщик У/1пд0%/$ представ- 
ляет собой многоуровневую очередь с обратной связью. 


Системный процесс простоя содержит поток, который выполняется при отсутствии 
любого потока, назначенного пользователю или системе и находящегося в состоя- 
нии ожидания. Процесс простоя может состоять всего из одной инструкции про- 
цессора, задающей бесконечный цикл. Некоторые операционные системы в перио- 
ды простоя вместо выполнения цикла простоя переводят систему в режим 
энергосбережения. 


Доля процессорного времени, потребляемого запущенными процессами, вычисля- 
ется путем определения доли времени, в течение которого система выполняла ак- 
тивный поток в период измерения. На рис. 5.1 показан Везоигсе Мопиог (Монитор 
ресурсов) \Мт4о\з$, демонстрирующий запущенные процессы, потребляющие наи- 
большую в среднем долю процессорного времени. 
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Рис. 5.1. Экран сведений о процессах в Кезоигсе Мопйог И/пдоу/$ 


На снимке экрана показано, что в столбце РПО (ИД процесса) отображаются число- 
вые идентификаторы процессов, а в столбце ТВгеад$ (Потоки) — количество пото- 
ков в процессе. Все процессы, показанные на этом экране, находятся в состоянии 
Випишо (Выполняется). 


На рис. 5.2 показан результат выполнения команды Фор в системе Глпих. 


В верхней части экрана содержится сводная информация, включая количество про- 
цессов, называемых здесь задачами (ТазК$), в каждом из возможных состояний. 


Каждая строка в нижней части экрана представляет информацию об одном запу- 
щенном процессе. Как и в \Мтдо\5, в столбце РТО показаны идентификаторы про- 
цессов. Состояние каждого процесса отражено в столбце $ со следующими воз- 
можными значениями: 


е К— готов к запуску: процесс либо запущен, либо находится в очереди гото- 
вых к запуску потоков; 
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е 5—_ ожидание: приостановлен на время блокировки; ожидание завершения 
события; 


е Т—_ остановлен в ответ на команду управления заданием (это действие вы- 
полняется при нажатии комбинации клавиш <С&]>+</>); 


е 7—_ "зомби": состояние, которое возникает, когда дочерний процесс, относя- 
щийся к другому процессу, завершается, но система продолжает выводить 
информацию об этом дочернем процессе до завершения родительского про- 
цесса. 


Ит@йт-Унеиа[Вох: - 


фор - 18:16:25 ир 11:16, 1 ч5ег, Тюад ауегаде: 0.90, 0.2 0.07 

ТазК5: 183 тота|, 1 гипп1п9, 182 5\1еер\1по, 0 ред хотбте 

%Срич( 5): 4.8 и5, 1.0 $у, 0.0 п4, 94.2193, 0.60 ма, .0 В 0.90 5%: ве 
КВ М : 4046384 тота1, 1135716 Ггее, 900736 изес 2009932 БиГГ/саспе 

К1В 5мар: @ Тога\, 9 Ггее, 9 зе. 2798540 ауа11 Мет 


НВ $ ЖСРУ СОММАМО 
0 1224192 163008 81456 5 3.7 4.0 508:13.96 сотруг 
0 358516 г : 36 6 а 2.0.8 8.31 Хога 
0 945448 } ЕВЕ к. 4 пана 1 $ 
4 : : :-Тегмупа| - 
т 


‹иогКег / 
госу $зспед 


121 ; 
13 ГОО 
- 14. тоое 


Рис. 5.2. Экран с информацией о процессах пих, выведенной по команде Фор 


В столбце РВ отображается приоритет планирования процесса. Меньшие числа обо- 
значают более высокие приоритеты. 


До этого момента мы говорили о процессоре компьютера как о единичной сущно- 
сти. В большинстве современных ПК интегральная схема процессора содержит не- 
сколько ядер, каждое из которых реализует функции полноценного независимого 
процессора, включая блок управления, набор регистров и АЛУ. В следующем раз- 
деле обсуждаются атрибуты систем, содержащих несколько процессорных блоков. 


Многопроцессорность 


Многопроцессорный компьютер содержит два процессора или более, которые од- 
новременно выполняют последовательности инструкций. Процессоры в такой сис- 
теме обычно совместно используют системные ресурсы, например основную па- 
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мять и периферийные устройства. Процессоры в многопроцессорной системе могут 
иметь одинаковую архитектуру или отдельные процессоры могут иметь отличную 
от других архитектуру для поддержки уникальных системных требований. Систе- 
мы, в которых все процессоры рассматриваются как равноправные, называют сис- 
темами с симметричной многопроцессорной архитектурой. Устройства, содер- 
жащие несколько процессоров в составе одного пакета интегральных схем, 
называются многоядерными процессорами. 


На уровне планировщика операционной системы симметричная многопроцессор- 
ная среда просто предоставляет больше процессоров для использования в планиро- 
вании потоков. В таких системах планировщик рассматривает дополнительные 
процессоры как ресурсы при назначении потоков для выполнения. 


В хорошо спроектированной симметричной многопроцессорной системе пропуск- 
ная способность может приблизиться к идеальному сценарию линейного масшта- 
бирования (пропорционально количеству доступных процессорных ядер) при до- 
пущении, что конкуренция за общие ресурсы минимальна. Например, если 
несколько потоков на отдельных ядрах попытаются одновременно получить массо- 
вый доступ к основной памяти, неизбежно произойдет снижение производительно- 
сти, поскольку система распределяет доступ к ресурсам между конкурирующими 
потоками. Многоканальный интерфейс динамической памяти ОКАМ может повы- 
сить общую производительность системы в этом сценарии. 


Симметричная многопроцессорная система является примером архитектуры 
с множеством потоков инструкций и множеством потоков данных (шире 
ш5исбоп, тшШаре даа, МТМО). МГМО — это конфигурация параллельной обра- 
ботки, в которой каждое ядро процессора выполняет независимую последователь- 
ность инструкций на собственном наборе данных. Конфигурация параллельной об- 
работки с одним потоком инструкций и множеством потоков данных (5т2]е 
шугасНноп, тшШаре даа, $ПМО), для сравнения, одновременно выполняет одну и ту 
же инструкцию над несколькими элементами данных. 


Современные процессоры реализуют инструкции ЗПМРО для выполнения парал- 
лельной обработки больших наборов данных, таких как графические изображения 
и последовательности аудиоданных. В ПК текущего поколения использование 
многоядерных процессоров обеспечивает параллелизм выполнения МИМЮ, а спе- 
циализированные инструкции внутри процессоров гарантируют определенную 
степень параллелизма выполнения 51МО. Обработка 5ПМР будет обсуждаться 
далее в главе 8. 


Тактовая частота процессора выросла с 4,77 МГц в оригинальном [ВМ РС до более 
чем 4 ГГц в современных процессорах, что почти в тысячу раз больше. В будущем 
увеличение тактовой частоты, вероятно, будет менее динамичным, поскольку на 
этом пути перед нами встают фундаментальные физические ограничения. Для того 
чтобы компенсировать ограниченный прирост производительности за счет увели- 
чения тактовой частоты, процессорная отрасль обратила особое внимание на раз- 
личные формы параллелизма выполнения в персональных компьютерах и интел- 
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лектуальных устройствах. В будущем, вероятно, тенденция роста параллелизма 
продолжится, поскольку системы будут объединять десятки, затем сотни и в ко- 
нечном счете тысячи процессорных ядер, параллельно работающих на ПК, смарт- 
фонах и других цифровых устройствах. 


Резюме 


Эта глава началась с обзора драйверов устройств, включая подробные сведения о 
последовательностях инструкций, используемых кодом драйвера для чтения и за- 
писи данных в простое устройство ввода-вывода: параллельный порт ПК. Затем мы 
обсудили системы — устаревшую В1О$ и новую ЧЕРТ, которые предоставляют 
код, выполняемый сразу после включения ПК и обеспечивающий тестирование и 
инициализацию устройства, а также загрузку операционной системы. Мы увидели, 
как процесс доверенной загрузки помогает гарантировать, что во время запуска 
системы разрешается выполнение только авторизованного и не подвергшегося из- 
менениям кода. 


Затем мы перешли к описанию некоторых фундаментальных элементов операцион- 
ных систем, включая процессы, потоки и планировщик. Были представлены раз- 
личные алгоритмы планирования, нашедшие применение в компьютерах прошлого 
и в современных системах. Мы рассмотрели выходные данные инструментов, реа- 
лизованных в операционных системах Глпих и \/т4о\/з, которые предоставляют 
информацию о запущенных процессах. 


Глава завершилась обсуждением многопроцессорной обработки и ее влияния на 
производительность современных компьютерных систем, а также последствий вне- 
дрения параллельной обработки в архитектурах МИМО и $1МО для будущего вы- 
числительной техники. 


В следующей главе будут представлены различные области, где требуются специа- 
лизированные вычисления, и их уникальные требования к вычислениям в реальном 
времени, цифровой обработке сигналов и работе графического процессора (СРО). 


Упражнения 


1. Перезагрузите компьютер и войдите в раздел настроек ВОЗ или ОЕЕРГ. Изучите 
каждое из доступных в этом разделе меню. Какую систему использует ваш 
компьютер, ВОЗ или ЧЕЕ!Г? Поддерживает ли ваша материнская плата разгон 
процессора? Когда вы закончите, обязательно выберите вариант выхода без со- 
хранения изменений, если только вы не обладаете полной уверенностью в том, 
что хотите внести изменения. 


2. Выполните соответствующую команду на компьютере, чтобы отобразить ин- 
формацию о текущих запущенных процессах. Какой идентификатор Ргосез$ ШО 
(РПЛ) имеет процесс, который вы используете для выполнения этой команды? 


Специализированные 
вычисления 


Большинство пользователей компьютеров имеют как минимум общее представле- 
ние о ключевых характеристиках ПК и интеллектуальных цифровых устройств, 
связанных с производительностью, таких как скорость процессора и объем опера- 
тивной памяти (гапдот ассез$ тетогу, КАМ). Эта глава исследует требования к 
производительности, свойственные областям вычислений, которые, как правило, 
менее очевидны для большинства пользователей, включая системы реального вре- 
мени, цифровую обработку сигналов и обработку данных в графических процес- 
сорах (2тарб1с$ ргосеззтв ити, СРО). 


Мы изучим уникальные вычислительные функции, связанные с каждой из этих об- 
ластей, и рассмотрим примеры современных устройств, реализующих эти функции. 


После прочтения этой главы вы будете знать, в каких областях требуются вычисле- 
ния в реальном времени, и разбираться в основных концепциях цифровой обработ- 
ки сигналов в контексте ее широкого применения в беспроводной связи. Вы также 
ознакомитесь с базовой архитектурой современных графических процессоров и с 
некоторыми современными реализациями компонентов в областях вычислений, 
обсуждаемых в этой главе. 


В этой главе рассматриваются следующие темы: 
» вычисления в реальном времени; 
» цифровая обработка сигналов; 
» обработка данных в графических процессорах; 


е Примеры специализированных архитектур. 
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Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 
В@рз://2ВиБ.сот/РаскРи БИН тр/Модегп-Сотрщег-АгспИесиге-апд- 
Ограп17аНоп-Зесопд-ЕЧ оп. 


Вычисления в реальном времени 


В предыдущей главе было представлено краткое введение в некоторые требования 
к вычислениям в реальном времени с точки зрения способности системы реагиро- 
вать на изменения входных данных. Эти требования устанавливаются в виде пре- 
дельных сроков, ограничивающих время, которое может потребоваться системе для 
формирования выходных данных в ответ на изменение входных данных. В данном 
разделе эти временные ограничения рассматриваются более подробно, кроме того, 
здесь представлены некоторые функции, реализуемые в вычислительных системах 
реального времени для соблюдения временных требований. 


Вычислительные системы реального времени можно разделить на системы с мяг- 
кими и жесткими гарантиями реагирования на изменения входных данных. Счита- 
ется, что система мягкого реального времени работает приемлемо, если она вы- 
полняет требования по ожидаемому времени отклика большую часть времени, но 
. не обязательно все время. Примером приложения, работающего в реальном време- 
ни, является отображение часов на мобильном телефоне. При открытии окна с изо- 
бражением часов некоторые реализации этого приложения на мгновение отобра- 
жают время, которое было показано при последнем просмотре часов, после чего 
показания сразу же обновляются до правильного текущего времени. Пользователи, 
безусловно, хотели бы, чтобы часы показывали правильное время каждый раз, ко- 
гда они отображаются, но кратковременные сбои, подобные этому, обычно не рас- 
сматриваются как существенные проблемы. 


С другой стороны, система жесткого реального времени считается неработоспо- 
собной, если она когда-либо пропускает какой-либо из установленных сроков от- 
клика. Критически важные системы безопасности, такие как контроллеры подушек 
безопасности в автомобилях и системы управления полетом гражданского авиа- 
лайнера, имеют жесткие требования к работе в реальном времени. Разработчики 
таких систем очень серьезно относятся к требованиям по срокам реагирования и 
прилагают значительные усилия для того, чтобы процессор реального времени 
удовлетворял этим требованиям при любых возможных условиях эксплуатации. 


Поток управления простой системой реального времени показан на рис. 6.1. 


На рис. 6.1 представлена вычислительная система реального времени, использую- 
щая аппаратный интервальный таймер для управления временной последователь- 
ностью своей работы. 
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Инициализация таймера 
и устройств 
ввода-вывода 


Ожидание таймера 


Чтение входных данных 


Вычисление 
выходных данных 


Запись выходных данных 


Рис. 6.1. Поток управления системой реального времени 


Интервальный таймер с обратным отсчетом выполняет повторяющийся цикл сле- 
дующих действий: 


1. Загрузка в регистр счетчика заранее заданного числового значения. 
2. Пошаговое уменьшение значения счетчика с фиксированной тактовой частотой. 


3. Когда значение счетчика достигнет нуля: формирование события, например 
установка бита в регистре или вызов прерывания процессора. 


4. Возврат к шагу [. 


Интервальный таймер генерирует периодическую последовательность событий с 
точностью, зависящей от характеристик системных часов, для управления которы- 
ми часто используют кварцевый кристалл. Ожидая события таймера в начале каж- 
дого цикла, система, показанная на рис. 6.1, начинает каждый проход выполнения 
через фиксированные, почти равные промежутки времени. 


Для того чтобы удовлетворить требования жесткого реального времени, время вы- 
полнения кода внутри цикла (кода, содержащегося в блоках "Чтение входных данных", 
"Вычисление выходных данных" и "Запись выходных данных" на рис. 6.1) всегда 
должно быть меньше, чем интервал таймера. Предусмотрительные разработчики 
систем внимательно следят за тем, чтобы ни один путь через код не мог довести 
время выполнения до предела жесткого реального времени. Консервативное прави- 
ло проектирования системы может состоять в том, что самый длинный путь выпол- 
нения кода внутри цикла не должен занимать более 50% интервала таймера. 


Практические системы реального времени, построенные в такой конфигурации, 
могут быть основаны на 8-, 16- или 32-разрядном процессоре, работающем на так- 
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товой частоте в диапазоне от десятков до сотен мегагерц. Таймер, используемый в 
основном цикле таких систем, генерирует события с выбранной разработчиком 
частотой, как правило, в диапазоне от 10 до 1000 Гц. 


В менее сложных системах код, представленный блоками на рис. 6.1, часто выпол- 
няется непосредственно на аппаратных средствах процессора без задействования 
промежуточных программных уровней. Эта конфигурация не предусматривает 
использования операционной системы реального времени, описанной в главе 5. 
С другой стороны, сложное приложение реального времени по всей вероятности 
будет иметь более широкие потребности, чем те, что можно реализовать с помо- 
щью этой упрощенной архитектуры, и это делает привлекательным использование 
операционной системы реального времени. 


Операционные системы реального времени 


Операционная система реального времени (ОСРВ) имеет ряд особенностей, 
внешне схожих с операционными системами общего назначения, рассмотренными 
в главе 5. Однако архитектура ОСРВ значительно отличается от операционных сис- 
тем общего назначения в том, что все аспекты ОСРВ — от внутренних структур 
ядра до драйверов устройств и системных сервисов — сосредоточены на удовле- 
творении требований жесткого реального времени. 


В большинстве ОСРВ используется принцип вытесняющей многопоточности, часто 
называемый в литературе по ОСРВ многозадачностью. Термины "задача" и "по- 
ток" в контексте ОСРВ являются в некотором роде синонимами, поэтому для по- 
следовательности изложения мы будем продолжать использовать термин "поток" 
для обозначения задач ОСРВ. 


Архитектуры ОСРВ на нижнем конце шкалы сложности обычно поддерживают 
многопоточность в контексте одного прикладного процесса. Эти более простые 
ОСРВ поддерживают приоритизацию потоков, но часто не имеют функций защиты 
памяти. 


Более сложные архитектуры ОСРВ предоставляют такие функции операционной 
системы, как защита памяти, в дополнение к вытесняющей многопоточности с при- 
оритизацией. В этих ОСРВ несколько процессов могут одновременно находиться в 
состоянии Аинтия (Выполняется), при этом каждый из процессов может содержать 
несколько потоков. В системах с защитой памяти доступ к памяти ядра со стороны 
потоков приложений запрещен, и приложения не могут проникать в области памя- 
ти друг друга. 

Среды ОСРВ, от низшего до высшего уровня сложности, предоставляют несколько 
структур данных и методов взаимодействия, направленных на обеспечение эффек- 
тивного обмена данными между потоками, а также на поддержку контролируемого 
доступа к общим ресурсам. Эти возможности часто доступны, и не только в ОСРВ. 
Вот несколько примеров таких возможностей. 


е Взаимное исключение, или мьютекс (тишех, от англ. тшиа[ ехсшяюоп), — 
это механизм, позволяющий потоку затребовать доступ к общему ресурсу, не 
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блокируя выполнение других потоков. В своей простейшей форме взаимное 
исключение реализуется с помощью доступной всем потокам переменной, 
которая имеет значение 0, когда ресурс свободен, и 1, когда ресурс занят. По- 
ток, которому требуется ресурс, считывает текущее значение такой перемен- 
ной, и если оно равно 0, присваивает ей значение |, после чего выполняет 
операцию с использованием этого ресурса. После завершения операции по- 
ток возвращает этой переменной значение 0. В то же время использование 
взаимных исключений сопровождается рядом следующих потенциальных 
проблем. 


Вытеснение потоков. Допустим, поток считывает переменную взаимного 
исключения и обнаруживает, что она равна 0. Поскольку планировщик 
способен прервать выполняющийся поток в любое время, этот поток мо- 
жет быть прерван до того, как он успеет установить для переменной зна- 
чение 1. Затем возобновляется выполнение другого потока, который берет 
под контроль тот же ресурс, т. к. видит, что переменная все еще равна 0. 
Когда возобновляется выполнение первого потока, он заканчивает уста- 
новку для переменной значения | (хотя к этому моменту она уже равна 1). 
В этот момент оба потока ошибочно полагают, что у них есть исключи- 
тельный доступ к данному ресурсу, что, скорее всего, приведет к серьез- 
ным проблемам, если оба потока попытаются использовать этот ресурс. 


Для того чтобы предотвратить такой сценарий, во многих процессорах 
реализуют некоторую форму инструкции "проверить-установить". Ин- 
струкция "проверить-установить" считывает значение из ячейки памяти и 
устанавливает для этой ячейки значение 1 за одно непрерываемое дейст- 
вие (также называемое неделимым). В архитектуре х86 эту операцию вы- 
полняет инструкция вт$ (проверка и установка бита). В архитектурах про- 
цессоров, где отсутствует инструкция типа "проверить-установить" 
(например, 6502), риск вытеснения можно устранить путем отключения 
прерываний перед проверкой состояния переменной взаимного исключе- 
ния и последующего включения прерываний после присвоения этой пере- 
менной значения 1. Недостатком этого подхода является снижение скоро- 
сти реагирования в реальном времени в период отключения прерываний. 


Инверсия приоритетов происходит, когда поток с более высоким при- 
оритетом пытается получить доступ к ресурсу, в то время как соответст- 
вующая переменная взаимного исключения удерживается под контролем 
потока с более низким приоритетом. В такой ситуации ОСРВ обычно пе- 
реводят более приоритетный поток в заблокированное состояние, позво- 
ляя низкоприоритетному потоку завершить свою работу и освободить пе- 
ременную. 


Проблема с инверсией приоритетов возникает, когда начинается выполне- 
ние потока с приоритетом, который находится между уровнями приорите- 
тов первых двух потоков. Во время работы этого среднеприоритетного по- 
тока выполнение низкоприоритетного потока остановлено, и он не может 
освободить переменную взаимного исключения. Высокоприоритетный по- 
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ток теперь должен ждать, пока закончится выполнение среднеприоритет- 
ного потока, что фактически нарушает всю схему приоритетов потоков. 
Это может привести к тому, что высокоприоритетный поток не сможет 
уложиться в заданный срок. 


Одним из методов предотвращения инверсии приоритетов является на- 
следование приоритетов. В ОСРВ, где реализовано наследование при- 
оритетов, каждый раз, когда поток с более высоким приоритетом 
(11_«Игеаа) запрашивает доступ к переменной взаимного исключения, 
удерживаемой потоком с более низким приоритетом (1о_+Нгеаа), приоритет 
потока 1о_+Нгеаа временно повышается до уровня |11_4пгеад. Это исключает 
любую возможность того, что поток со средним приоритетом задержит за- 
вершение (первоначально) более низкоприоритетного потока 1о_+йгеаа. 
Когда поток 1о_&Нгеад освобождает переменную взаимного исключения, 
ОСРВ восстанавливает первоначальный приоритет этого потока. 


Взаимная блокировка может возникнуть, когда несколько потоков пы- 
таются заблокировать несколько переменных взаимного исключения. Если 
потоки Нгеад1 и «Пгеад2 требуют контроля над переменными взаимного 
исключения пифех1 и пиех2, может возникнуть ситуация, в которой поток 
{Кгеад1 блокирует переменную пшех1 и пытается заблокировать перемен- 
ную пщех2, в то время как поток %пгеад2 уже заблокировал переменную 
пифех2 и пытается заблокировать переменную тикех1. В такой ситуации ни 
одна из этих задач не может выполняться, отсюда и термин "взаимная 
блокировка". Некоторые реализации ОСРВ проверяют принадлежность 
переменных взаимного исключения при попытке их заблокировать и со- 
общают об ошибке в ситуации взаимной блокировки. В более простых 
ОСРВ разработчик системы должен убедиться, что возникновение взаим- 
ной блокировки невозможно. 


Семафор — это обобщение переменной взаимного исключения. Различают 
семафоры двух типов: двоичный и подсчитывающий. 


" Двоичный семафор похож на взаимное исключение, с той разницей, что 


он скорее предназначен не для контроля над доступом к ресурсу, а для то- 
го, чтобы одна задача могла отправить сигнал другой задаче. Если поток 
{Игеад1 пытается взять под контроль семафор зетарпоге1, когда он недос- 
тупен, Пгеаа1 блокируется до тех пор, пока другой поток или процедура 
обслуживания прерываний не передаст контроль над семафором 
зетарпоге1. 


Подсчитывающий семафор содержит счетчик с верхним пределом. Под- 
считывающие семафоры используются для контроля доступа к несколь- 
ким взаимозаменяемым ресурсам. Когда поток берет под контроль под- 
считывающий семафор, значение счетчика увеличивается, и задача 
выполняется. Когда счетчик достигает своего предела, поток, пытающийся 
взять под контроль семафор, блокируется до тех пор, пока другой поток не 
отдаст контроль над этим семафором, уменьшив значение счетчика. 
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Рассмотрим пример системы, которая поддерживает ограниченное коли- 
чество одновременно открытых файлов. 


Для управления операциями открытия и закрытия файлов можно исполь- 
зовать подсчитывающий семафор. Если система поддерживает до 10 от- 
крытых файлов и поток пытается открыть 11-й файл, подсчитывающий 
семафор с пределом 10 будет блокировать операцию открытия файла до 
тех пор, пока не будет закрыт другой файл и не станет доступен его деск- 
риптор. 


» Очередь (другое название — очередь сообщений) — это однонаправленный 
путь связи между процессами или потоками. Отправляющий поток помещает 
элементы данных в очередь, а получающий поток извлекает эти элементы в 
том же порядке, в котором они были отправлены. ОСРВ синхронизирует дос- 
туп между отправителем и получателем, поэтому получатель получает только 
полные элементы данных. Очереди обычно реализуются с буфером хранения 
фиксированного размера. Буфер со временем заполняется и блокирует даль- 
нейшее добавление данных, если поток-отправитель добавляет элементы 
данных быстрее, чем поток-получатель их извлекает. 


Очереди сообщений ОСРВ предоставляют программный интерфейс, позво- 
ляющий потоку-получателю проверить, содержит ли очередь данные. Многие 
реализации очередей также поддерживают использование семафора для по- 
дачи сигнала заблокированному потоку-получателю о появлении данных. 


» Критическая секция. Обычной является ситуация, при которой нескольким 
потокам требуется доступ к общей структуре данных. При использовании 
общих данных очень важно, чтобы операции чтения и записи, выполняемые 
разными потоками, не накладывались во времени друг на друга. Когда такое 
наложение происходит, считывающий поток может получить противоречи- 
вую информацию, если он обращается к структуре данных в то время, когда 
другой поток выполняет ее обновление. Механизмы взаимного исключения и 
семафора предоставляют возможности для управления доступом к общим 
структурам данных. Использование критической секции — это альтернатив- 
ный подход, который изолирует код, обращающийся к общей структуре дан- 
ных, и разрешает только одному потоку в любой момент времени выполнять 
эту последовательность. 


Нростым методом реализации критической секции является отключение пре- 
рываний непосредственно перед входом в критическую секцию и их после- 
дующее включение после выполнения критической секции. Это предотвра- 
щает запуск планировщика и предоставляет потоку, обращающемуся к 
структуре данных, возможность единоличного управления до выхода из кри- 
тической секции. Однако этот метод имеет недостаток — он снижает ско- 
рость реакции в реальном времени, поскольку не позволяет реагировать на 
прерывания, в том числе выполнять функции планирования потоков, пока 
прерывания отключены. 
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Некоторые ОСРВ предлагают более сложную реализацию метода критической сек- 
ции с использованием объектов данных критической секции. Объекты критической 
секции обычно предоставляют возможность выбора: поток может либо перейти в 
заблокированное состояние, пока критическая секция не станет доступной, либо 
проверить, используется ли критическая секция, без блокировки. Функция провер- 
ки доступности критической секции позволяет потоку выполнять другую работу в 
ожидании, пока критическая секция освободится. 


Сегодня в эксплуатации находится гораздо больше вычислительных систем реаль- 
ного времени, чем персональных компьютеров, которые мы воспринимаем как 
компьютеры. Компьютеры общего назначения составляют менее 1% цифровых 
процессоров, выпускаемых каждый год. Самые разные устройства — от детских 
игрушек до цифровых термометров, телевизоров, автомобилей и космических ко- 
раблей — содержат как минимум один, а зачастую и десятки встроенных процессо- 
ров, каждый из которых работает под управлением ОСРВ того или иного типа. 


В этом разделе было дано краткое введение в некоторые возможности обмена дан- 
ными и управления ресурсами, распространенные в различных реализациях ОСРВ. 
В следующем разделе представлены архитектуры, используемые при обработке 
цифровых выборок аналоговых сигналов. 


Цифровая обработка сигналов 


Процессор для цифровой обработки сигналов (42а 51епа| ргосеззог, ОЗР) — 
это процессор, оптимизированный для выполнения вычислений над оцифрованны- 
ми представлениями аналоговых сигналов. Используемые в реальном мире сигна- 
лы, такие как аудио, видео, радиочастотные (РЧ) сигналы сотовых телефонов и 
сигналы радаров, являются аналоговыми по своей природе. Это означает, что об- 
рабатываемая информация — это реакция электрического датчика на непрерывно 
меняющееся входное напряжение. Прежде чем цифровой процесс может начать 
работать с аналоговым сигналом, напряжение сигнала должно быть преобразовано 
в цифровую форму с помощью аналого-цифрового преобразователя (АЦП). 
В следующем разделе описывается работа АЦП и цифроаналоговых преобразо- 
вателей (ЦАП). 


АЦП и ЦАП 


АЦП измеряет аналоговое входное напряжение и выдает на выходе цифровое сло- 
во, представляющее величину входного напряжения. ЦАП выполняет операцию, 
обратную АЦП, преобразуя цифровое слово в аналоговое напряжение. В процессе 
преобразования АЦП часто используют внутренний ЦАП. 


В применяемых на практике ЦАП используются схемы различных архитектур. Это 
делается, как правило, с целью получения требуемого сочетания низкой стоимости, 
высокой скорости и высокой точности. Одной из простейших архитектур ЦАП явля- 
ется лестница К—2К, показанная на рис. 6.2 в конфигурации с 4-разрядным входом. 
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Рис. 6.2. ЦАП лестничного типа В-2К 


Этот ЦАП использует 4-разрядное слово данных на входах 4-4 (где 4 является 
наиболее значимым битом) для получения аналогового напряжения Ио. Если пред- 
положить, что состояние каждого бита 4-разрядного слова 4 определяется напря- 
жением 0 В (для бита со значением 0) или 5 В (для бита со значением 1), выходное 
напряжение Г равно (4/2“) х 5 В, где а является значением в диапазоне от 0 до 15. 
Входное слово со значением 0 дает на выходе напряжение 0 В, а входное слово со 
значением 15 — (15/16) х5 В = 4,6875 В. Промежуточные значения слова 4 дают на 
выходе равномерно распределенные напряжения с шагом (1/16) х 5 В = 0,3125 В. 


АЦП может использовать внутренний ЦАП, подобный описанному выше (хотя 
обычно с большей разрядностью и, соответственно, более высоким разрешением по 
напряжению), вместе со схемой выборки-хранения для определения цифрового эк- 
вивалента аналогового входного напряжения. Поскольку аналоговый входной сиг- 
нал может меняться непрерывно с течением времени, схемы АЦП обычно исполь- 
зуют схему выборки-хранения для поддержания постоянного аналогового 
входного напряжения в процессе преобразования. Схема выборки-хранения пред- 
ставляет собой аналоговое устройство с дискретным входным сигналом удержания. 
Когда вход удержания неактивен, выход схемы повторяет входное напряжение. Ко- 
гда вход удержания активен, схема выборки-хранения фиксирует и удерживает вы- 
ходное напряжение на уровне входного напряжения, которое присутствовало в мо- 
мент появления сигнала удержания. 


При постоянном сигнале на выходе схемы выборки-хранения АЦП использует свой 
ЦАП для определения цифрового эквивалента входного напряжения. Для этого 
АЦП использует компаратор, представляющий собой схему, которая сравнивает 
два аналоговых напряжения и выдает дискретный выходной сигнал, указывающий, 
какое из двух напряжений выше. АЦП подает выходное напряжение схемы выбор- 
ки-хранения на один вход компаратора, а выходное напряжение ЦАП — на другой 
его вход, как показано на рис. 6.3, где размер входного слова ЦАП равен и битам. 


Задача АЦП заключается в нахождении входного слова ЦАП, которое приводит к 
изменению состояния компаратора. Простой способ сделать это — вести отсчет от 
нуля, записывая каждое числовое значение на вход ЦАП и наблюдая за выходом 
компаратора, чтобы понять, изменилось ли его состояние. Выходной сигнал ЦАП, 
который первым вызовет изменение состояния компаратора, является наименьшим 
выходным напряжением ЦАП, которое больше выходного напряжения схемы вы- 
борки-хранения. Фактическое зафиксированное аналоговое напряжение находится 
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между этим значением выходного напряжения ЦАП и его значением, когда на вход 
ЦАП подается слово данных на один отсчет меньше. АЦП такой конфигурации на- 
зывают АЦП последовательного счета. 


Аналоговый 
вход 


Схема 
выборки- 
- хранения 


Выход 
компаратора 


Компаратор 


Управление Вход ЦАП 
схемой выборки- 
хранения 


Рис. 6.3. Архитектура АЦП 


Несмотря на простоту концепции, АЦИ последовательного счета может быть до- 
вольно медленным, особенно при большом размере слова. Более быстрый метод 
заключается в последовательном сравнении каждого бита в слове данных ЦАП, 
начиная с наиболее значимого бита (43). Если начать со слова данных 10006 для 
нашего примера с 4-разрядной схемой, то первое показание компаратора позволит 
определить местоположение уровня аналогового входного напряжения — выше 
или ниже средней точки диапазона напряжения ЦАП. Таким образом определяется 
значение бита 4 показания АЦП: 0 или 1. Используя известное значение (5, уста- 
навливаем 4 равным 1, чтобы определить, в пределах какой четверти полного диа- 
пазона находится входное напряжение. Эта процедура повторяется для последова- 
тельного определения каждого из оставшихся битов и заканчивается на младшем 
значащем бите. 


Такой метод преобразования в АЦП называется последовательным приближени- 
ем. АЦП последовательного приближения работает намного быстрее, чем АЦП по- 
следовательного счета. В нашем примере максимально возможное количество 
сравнений уменьшается с 16 до 4. В 12-разрядном АЦП последовательного при- 
ближения максимально возможное число сравнений уменьшается с 4096 до 12. 
В общем случае, использование метода последовательного приближения вместо 
последовательного счета уменьшает максимальное количество шагов для и-разряд- 
ного АЦП с 2” до п. АЦП последовательного приближения имеют разрешение 
от 8 до 18 бит и максимальную частоту преобразования до нескольких мегагерц. 


АЦП и ЦАП характеризуются разрешающей способностью и максимальной скоро- 
стью преобразования. Разрешение АЦП или ЦАП определяется количеством битов 
в его слове данных. Максимальная скорость преобразования определяет, насколько 
быстро АЦП или ЦАП может выдавать последовательные выходные данные. 
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При обработке данных в реальном времени АЦП выполняет последовательность 
измерений через периодические промежутки времени, получая входные данные для 
дальнейшей обработки. Требования к разрешению слов данных и частоте дискрети- 
зации сильно различаются в зависимости от конкретного применения ОЪЗР. Вот не- 
которые примеры стандартных форматов оцифрованных аналоговых данных. 


» Цифровой звук для компакт-дисков дискретизируется с частотой 44,1 кГц и 
16 битами на выборку в двух каналах, соответствующих левому и правому 
динамикам. 


» Видеокамеры измеряют аналоговый сигнал интенсивности света, полученный 
от каждого пиксела двумерной матрицы, и преобразуют полученные показа- 
ния в цифровое слово размером, как правило, 8 бит. Отдельные, расположен- 
ные близко друг к другу датчики с цветовыми фильтрами производят изме- 
рения для красного, зеленого и синего цветов в каждом пикселе изображения. 
Полный набор данных для одного пиксела насчитывает 24 бита, состоящих 
из трех 8-битных значений цвета. Одно изображение может содержать десят- 
ки миллионов пикселов, а видеокамеры обычно выдают от 30 до 60 кадров в 
секунду. Так как цифровое видео производит огромный объем данных, для 
снижения требований к их хранению и передаче обычно используются алго- 
ритмы сжатия. 


» Мобильный телефон содержит радиочастотный приемопередатчик, который 
преобразует принятый радиосигнал в частотный диапазон, подходящий для 
ввода в АЦП. Типичные параметры для АЦП мобильного телефона: 12-битное 
разрешение и частота дискретизации 50 МГц. 


» Автомобильная радарная система отбирает радиочастотную энергию, отра- 
женную от близлежащих препятствий, с разрешением 16 бит и частотой 
5 МГц. 


В следующем разделе мы рассмотрим требования к обработке сигналов для после- 
довательностей данных, захваченных АЦП. 


Особенности аппаратных средств ОЗР 


Процессоры цифровой обработки сигналов (ОР) оптимизированы для выполнения 
алгоритмов обработки цифровых выборок аналоговой информации. Скалярное 
произведение — это фундаментальная операция, используемая во многих алго- 
ритмах, выполняемых ОР. Если а и Б представляют собой два вектора равной 
длины (вектор — это одномерный массив числовых значений), то их скалярное 
произведение вычисляется путем умножения каждого элемента 4 на соответст- 
вующий элемент Б и суммирования полученных произведений. С математической 
точки зрения, если длина каждого вектора равна я (с индексами от 0 доя- 1), то 
скалярное произведение векторов равно: 


п-1 
а. = Уав = аб, +аб, +а,Б, +...+а В. 
1=0 
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Повторяющийся характер вычисления скалярного произведения указывает естест- 
венный путь для оптимизации производительности в цифровых системах. Основная 
операция, выполняемая при вычислении скалярного произведения, называется ум- 
ножением с накоплением (ти!@р/у асситиае, МАС). 


Одна операция МАС состоит из перемножения двух чисел и добавления результата 
в аккумулятор, который был инициализирован путем обнуления перед вычислени- 
ем скалярного произведения. Математическая производительность чипов ОЗР 
обычно измеряется в количестве операций МАС в секунду. Многие архитектуры 
ОЗР способны выполнить одну операцию МАС за один тактовый цикл выполнения 
инструкций. 


Для того чтобы выполнять такую операцию в каждом такте, ОР не может выде- 
лять отдельные такты для чтения инструкции МАС из памяти программ, чтения 
каждого из умножаемых векторов из памяти данных, вычисления произведения и 
добавления его в аккумулятор. Все эти действия необходимо выполнить за один шаг. 


Архитектура фон Неймана, представленная в главе 1, использует единую область 
памяти для программных инструкций и данных. Такая конфигурация приводит к 
ограничению, известному как узкое место архитектуры фон Неймана, возни- 
кающему в результате необходимости передавать как инструкции программ, так и 
значения данных через единый интерфейс "процессор — память". 


Это ограничение можно устранить с помощью архитектуры, которая разделяет 
хранилище программ и данных на две отдельные области памяти, каждая из кото- 
рых имеет собственный интерфейс для обмена данными с процессором. В такой 
конфигурации, называемой гарвардской архитектурой, программные инструкции 
и операции доступа к памяти данных можно выполнять параллельно, благодаря 
чему требуется меньшее число тактов. Гарвардская архитектура будет обсуждаться 
более подробно в главе 7. 


Процессор ОЗР с гарвардской архитектурой должен выполнить две операции об- 
ращения к памяти данных для извлечения элементов векторов а и р, которые тре- 
буется перемножить с помощью операции МАС. Обычно для этого требуются два 
такта, что не позволяет достичь целевого показателя производительности в одну 
операцию МАС за один такт. Модифицированная гарвардская архитектура 
поддерживает использование памяти программ для хранения значений данных в 
дополнение к инструкциям. Во многих приложениях ОР значения одного из век- 
торов (скажем, вектора а ), участвующих в операции скалярного произведения, яв- 
ляются постоянными величинами, известными на момент компиляции приложения. 
В модифицированной гарвардской архитектуре считываемые из АЦП в качестве 
входных данных элементы вектора а могут храниться в памяти программ, а эле- 
менты вектора Ь — в памяти данных. 


Для выполнения каждой операции МАС в этой архитектуре один элемент вектора 
а считывается из памяти программ, один элемент вектора Б считывается из памя- 
ти данных, а подлежащее накоплению произведение сохраняется во внутреннем 
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регистре процессора. Если ОЗР содержит кеш-память для программных инструк- 
ций, инструкция МАС, выполняющая каждый шаг для вычисления скалярного про- 
изведения, будет извлечена из кеша, как только первая операция МАС считает ее из 
памяти программ, что позволит исключить дальнейшие циклы доступа к памяти 
для ввода этой инструкции. Такая конфигурация (модифицированная гарвардская 
архитектура с кешированием программных инструкций) позволяет использовать 
выполняемые за один цикл операции МАС для всех итераций нахождения скаляр- 
ного произведения после завершения первой операции МАС. Поскольку векторы, 
участвующие в реальных вычислениях скалярного произведения, обычно содержат 
сотни или даже тысячи элементов, общая производительность операций вычисле- 
ния скалярного произведения может достаточно близко подойти к идеалу — одной 
операции МАС за такт ОЪР. 


Процессоры О$ЗР можно классифицировать по признаку поддержки их архитекту- 
рой операций с фиксированной и плавающей запятой. Процессоры ОЗР с фиксиро- 
ванной запятой для выполнения математических операций, таких как МАС, ис- 
пользуют целые числа со знаком или без знака. Процессоры ОЗР с фиксированной 
запятой, как правило, дешевле, чем процессоры ОР с плавающей запятой. Однако 
математика с фиксированной запятой может привести к проблемам с числами, та- 
ким как переполнение, которое может проявляться в превышении диапазона акку- 
мулятора результатов скалярных произведений. 


Для того чтобы уменьшить вероятность переполнения, для поддержки вычислений 
скалярного произведения длинных векторов в ОР часто используют аккумулятор 
расширенного диапазона, например шириной 40 бит в 32-разрядной архитектуре. 
Из-за опасений по поводу переполнения и связанных с этим проблем программиро- 
вание ОР с фиксированной запятой требует дополнительных усилий для исключе- 
ния вероятности того, что эти эффекты приведут к неприемлемому снижению про- 
изводительности. 


ВОЗР с плавающей запятой для внутренних вычислений часто используют 32-разряд- 
ные числа. Если ОЗР получает целочисленное значение АЦП, вся дальнейшая 
обработка выполняется с использованием операций с плавающей запятой. За счет 
использования преимуществ операций с плавающей запятой вероятность возникно- 
вения таких проблем, как переполнение, значительно снижается, что позволяет со- 
кратить циклы разработки программного обеспечения. 


Использование обработки с плавающей запятой также повышает достоверность 
результатов вычислений, что выражается в улучшении отношения "сигнал/шум" 
($12па]-ю-п015е гамно, ЭМВ.)) по сравнению с эквивалентной реализацией с фиксиро- 
ванной запятой. Вычисления с фиксированной запятой квантуют результат каждой 
математической операции на уровне младшего значащего бита целого числа. Опе- 
рации с плавающей запятой, как правило, дают точные результаты каждой опера- 
ции, при этом их точность находится в пределах незначительной доли соответст- 
вующего младшего значащего бита числа с фиксированной запятой. 
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Алгоритмы обработки сигналов 


Основываясь на нашем понимании аппаратных средств ОР и операций, которые 
они поддерживают, далее мы рассмотрим некоторые примеры алгоритмов цифро- 
вой обработки сигналов в реальных приложениях. 


Свертка 


Свертка — это формальная математическая операция наравне со сложением и ум- 
ножением. В отличие от сложения и умножения, которые работают с парами чисел, 
свертка работает с парами сигнальных векторов. В контексте ОЗР сигнал представ- 
ляет собой серию оцифрованных выборок меняющегося во времени входного сиг- 
нала, отобранных через равные промежутки времени. Свертка — это самая фунда- 
ментальная операция в области ОР. | 


Во многих практических приложениях одним из двух сигналов, участвующих в 
операции свертки, является фиксированный вектор чисел, хранящихся в памяти. 
Другой сигнал представляет собой последовательность выборок, полученных в ре- 
зультате измерений с помощью АЦП. 


Для того чтобы реализовать операцию свертки, при получении каждого измерения 
АЦП процессор ОЗР вычисляет измененный выходной сигнал, который является 
скалярным произведением фиксированного вектора данных (допустим, длина этого 
вектора равна п) и самых последних входных выборок в количестве и, полученных 
от АЦП. Для того чтобы вычислить свертку этих векторов, каждый раз при получе- 
нии выборки от АЦП процессор ОЗР должен выполнить и операций МАС. 


Фиксированный вектор в этом примере, обозначаемый й ‚ называется импульсной 
характеристикой. Цифровой импульс определяется как теоретически бесконечная 
последовательность отсчетов, в которой один отсчет равен 1, а все предыдущие и 
последующие отсчеты равны 0. Использование этого вектора в качестве входных 
данных для свертки с вектором й приводит к получению выходных данных, иден- 
тичных последовательности й ‚, окруженной предыдущими и последующими нуля- 
ми. Единственное значение | в импульсной последовательности умножает каждый 
элемент Йй в последовательных итерациях, в то время как все остальные элементы 
й умножаются на 0. 


— 


Конкретные значения, содержащиеся в векторе й, определяют влияние операции 
свертки на последовательность входных данных. Цифровая фильтрация является 
одним из распространенных применений свертки. 


Цифровая фильтрация 


Частотно-избирательный фильтр представляет собой схему или алгоритм, который 
принимает входной сигнал и передает его составляющие в нужных частотных диа- 
пазонах на выход без искажений, при этом устраняя или, по крайней мере, умень- 
шая до приемлемого уровня его составляющие в частотных диапазонах за предела- 
ми нужных диапазонов. 
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Мы все знакомы с регуляторами низких и высоких частот в аудиосистемах. Это 
примеры частотно-избирательных фильтров. Функция баса реализует фильтр 
нижних частот с переменным усилением. Это означает, что аудиосигнал фильтру- 
ется для выбора его низкочастотной части, после чего этот отфильтрованный сиг- 
нал подается на усилитель, который изменяет свою выходную мощность в зависи- 
мости от положения регулятора баса. Секция высоких частот реализована 
аналогичным образом, с использованием фильтра верхних частот для выбора бо- 
лее высоких частот в звуковом сигнале. Выходы этих усилителей объединяются 
для получения сигнала, посылаемого на динамики. 


Частотно-избирательные фильтры можно реализовать с помощью аналоговой тех- 
нологии или методов цифровой обработки сигналов. Простые аналоговые фильтры 
дешевы и требуют лишь нескольких схемных компонентов. Однако рабочие харак- 
теристики этих простых фильтров оставляют желать лучшего. 


Одними из основных параметров частотно-избирательного фильтра являются зату- 
хание в полосе задерживания и ширина переходной полосы. Затухание в полосе 
задерживания показывает, насколько хорошо фильтр справляется с устранением 
нежелательных частот на выходе. Как правило, фильтр не устраняет нежелательные 
частоты полностью, но для практических целей эти частоты можно уменьшить до 
настолько малого уровня, что они перестают иметь какое-либо значение. 


Переходная полоса фильтра — это диапазон частот между полосой пропускания и 
полосой задерживания. Полоса пропускания — это диапазон частот, которые 
должны быть пропущены через фильтр, а полоса задерживания — это диапазон 
частот, которые должны быть заблокированы фильтром. Невозможно обеспечить 
идеально четкую границу между полосой пропускания и полосой задерживания. 
Между этими полосами имеется некоторая переходная полоса, и чтобы сделать ее 
как можно более узкой, требуется более сложный фильтр, чем фильтр с более ши- 
рокой переходной полосой. 


Цифровой частотно-избирательный фильтр реализуется с помощью операции свертки 
с использованием тщательно подобранного набора значений для вектора й. При 
правильном выборе элементов Й можно спроектировать фильтры верхних и ниж- 
них частот, полосно-пропускающие и полосно-заграждающие фильтры. Как обсу- 
ждалось в предыдущих абзацах, фильтры верхних и нижних частот пропускают 
высокие и низкие частоты, соответственно, блокируя другие частоты. Полосно- 
пропускающий фильтр пропускает только частоты в пределах указанного диапа- 
зона и блокирует все частоты вне этого диапазона. Полосно-заграждающий фильтр 
пропускает все частоты, кроме тех, которые находятся в указанном диапазоне. 


Цели высокоэффективного частотно-избирательного фильтра — обеспечить мини- 
мальное искажение сигнала в полосе пропускания, эффективную блокировку час- 
тот в полосе задерживания и минимальную ширину переходной полосы. 


Для создания высокоэффективного аналогового фильтра может потребоваться 
сложная схема, включающая дорогостоящие прецизионные компоненты. С другой 
стороны, высокоэффективный цифровой фильтр реализуется с помощью всего 
лишь операции свертки. Цифровая схема, реализующая высокоэффективный фильтр 
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нижних частот с минимальными искажениями в полосе пропускания и узкой пере- 
ходной полосой, может потребовать длинный вектор й, содержащий, возможно, 
сотни или даже тысячи элементов. Решение о реализации такого фильтра в цифро- 
вом виде зависит от доступности недорогих ресурсов ОЗР, способных выполнять 
операции МАС со скоростью, требуемой назначением фильтра. 


Быстрое преобразование Фурье 


Преобразование Фурье, названное в честь французского математика Жана- 
Батиста Жозефа Фурье, раскладывает сигнал во временной области на набор сину- 
соидальных и косинусоидальных волн различных частот и амплитуд. Исходный 
сигнал можно восстановить путем суммирования этих волн посредством процесса, 
называемого обратным преобразованием Фурье. 


Процессоры ОР работают с отсчетами сигналов временной области, отбираемыми 
через фиксированные интервалы. Благодаря такому отбору реализация преобразо- 
вания Фурье в ОЗР называется дискретным преобразованием Фурье (ДПФ). 
В общем случае ДПФ преобразует последовательность из и равноотстоящих друг 
от друга временных отсчетов функции в последовательность из и отсчетов ДИФ, 
равноотстоящих друг от друга по частоте. 


Каждый отсчет ДПФ представляет собой комплёксное число, состоящее из дейст- 
вительного числа и мнимого числа. Мнимое число при возведении в квадрат дает 
отрицательный результат. 


Мы не будем здесь углубляться в математику мнимых чисел. Альтернативный спо- 
соб рассмотрения комплексного числа, представляющего частотную составляю- 
щую ДПФ (называемую частотным элементом), заключается в том, чтобы рас- 
сматривать действительную часть комплексного числа как множитель для 
косинусоидальной волны на частоте частотного элемента, а мнимую часть — как 
множитель для синусоидальной волны на той же частоте. Суммирование этих вол- 
новых составляющих дает представление во временной области для данного час- 
тотного элемента ДПФ. 


Простейшая реализация алгоритма ДПФ для последовательности длины и — это 
двойной вложенный цикл, в котором каждый из циклов выполняет итерацию п раз. 
Если требуется увеличить длину ДПФ, то количество математических операций 
возрастает пропорционально квадрату п. Например, для вычисления ДПФ сигнала 
длиной в 1000 отсчетов требуется не менее миллиона операций. 


В 1965 г. Джеймс Кули (]атез Соофеу) из ВМ и Джон Тьюки (оби ТикКеу) из 
Принстонского университета опубликовали работу, описывающую компьютерную 
реализацию более эффективного алгоритма ДПФ, который стал известен как бы- 
строе преобразование Фурье (БПФ). Описанный ими алгоритм был первоначаль- 
но изобретен немецким математиком Карлом Фридрихом Гауссом около 1805 г. 


Алгоритм БПФ разбивает ДПФ на меньшие ДПФ, где длины меньших ДПФ могут 
быть перемножены для получения количества отсчетов в исходном ДПФ. Повыше- 
ние эффективности, обеспечиваемое алгоритмом БИФ, является наибольшим, когда 
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длина последовательности для ДИФ равна степени числа 2, что позволяет выпол- 
нять рекурсивное разложение надвое по всей длине ДПФ. БПФ для 1024 точек тре- 
бует всего лишь нескольких тысяч операций по сравнению с более чем миллионом 
операций для реализации двойного вложенного цикла ДИФ. 


Важно понимать, что БИФ работает с той же последовательностью входных дан- 
ных, что и ДИФ, и выдает те же выходные данные, что и ДПФ, но БИФ делает это 
намного быстрее для более длинных последовательностей. 


БИФ используется для решения многих практических задач при обработке сигна- 
лов. Вот некоторые примеры. 


» Спектральный анализ. Выходные данные ДПФ для последовательности от- 
счетов временной области — это набор комплексных чисел, отражающих ам- 
плитуду синусоидальных и косинусоидальных волн в диапазоне частот, 
представляющем сигнал. Эти амплитуды прямо указывают, какие частотные 
компоненты присутствуют в сигнале со значительными уровнями, а какие 
частоты вносят меньший или пренебрежимо малый вклад. 


Спектральный анализ используется в таких областях, как обработка аудио- 
сигналов, изображений и радиолокационных сигналов. Лабораторные прибо- 
ры, называемые анализаторами спектра, обычно используются для тестиро- 
вания и контроля работы радиочастотных систем, таких как радиоприемники 
и радиопередатчики. 


Анализатор спектра показывает периодически обновляемое изображение, 
представляющее частотный состав входного сигнала, полученное с помощью 
БИФ, вычисленного по отсчетам этого сигнала. 


е Банки фильтров представляют собой наборы отдельных частотно- 
избирательных фильтров, каждый из которых обрабатывает отдельную поло- 
су частот. Полный набор фильтров в банке охватывает весь диапазон частот 
входного сигнала. Примером банка фильтров является графический эква- 
лайзер, используемый в высококачественной аудиоаппаратуре. 


Банк фильтров на основе БПФ полезен для разложения нескольких разделен- 
ных по частоте каналов данных, передаваемых в виде единого комбиниро- 
ванного сигнала. В приемнике БПФ разделяет принятый сигнал на несколько 
полос, каждая из которых содержит независимый канал передачи данных. 
Сигнал, содержащийся в каждой из этих полос, дополнительно обрабатыва- 
ется для извлечения его содержимого. 


Использование банков фильтров на основе БПФ широко распространено в 
радиоприемниках для систем широкополосной цифровой передачи данных, 
таких как цифровое телевидение и мобильная связь 50. 


» (Сжатие данных. сигнал можно сжать до меньшего размера путем выполне- 
ния БИФ и отбрасывания частотных составляющих, считающихся несущест- 
венными. Остальные частотные компоненты образуют меньший набор данных, 
который может быть дополнительно сжат с использованием стандартных ме- 
тодов кодирования. 
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Такой подход называется сжатием с потерями, поскольку часть информации 
входного сигнала теряется. Сжатие с потерями обычно приводит к большей 
степени сжатия сигнала по сравнению со сжатием без потерь. Алгоритмы 
сжатия без потерь используются в ситуациях, когда любая потеря данных не- 
допустима, например при сжатии компьютерных файлов данных. 


» Дискретное косинусное преобразование (ДКП) аналогично по концепции 
ДПФ, за исключением того, что вместо разложения входного сигнала на на- 
бор синусоидальных и косинусоидальных функций, как в ДПФ, при ДКП 
входной сигнал раскладывается только на косинусные функции, каждая из 
которых умножается на действительное число. Вычисление ДКИ можно ус- 
корить с помощью того же подхода, что используется в БФ для ускорения 
вычисления ДИФ. 


ДКП обладает тем ценным свойством, что во многих задачах сжатия данных 
большая часть информации о сигнале представлена в меньшем количестве 
коэффициентов ДКП по сравнению с альтернативными алгоритмами, такими 
как ДПФ. Это позволяет отбросить большее количество менее значимых час- 
тотных составляющих, повысив тем самым эффективность сжатия данных. 


Сжатие данных с помощью ДКП используется во многих прикладных областях, 
с которыми ежедневно взаимодействуют пользователи компьютеров и аудиовизу- 
альных развлекательных систем, включая аудио в формате МР3З, изображения в 
формате ЛРЕС (Лоти РВоюртаршс Ехрец$ Сточр) и видео в формате МРЕС (Моушв 
Расвхге Ехрец$ Огочцр). 


Процессоры ОЗР часто используют для решения задач, связанных с обработкой 
одно- и двумерных данных. Примерами одномерных данных являются аудиосигна- 
лы и радиочастотные сигналы, принимаемые приемопередатчиком мобильного те- 
лефона. Одномерные данные сигналов состоят из значения одного отсчета в каж- 
дый момент времени для каждого из нескольких входных каналов. 


Фотографическое изображение служит примером двумерных данных. Двумерное 
изображение описывается его шириной и высотой в пикселах и количеством битов, 
представляющих каждый пиксел. Каждый пиксел изображения отделен от окру- 
жающих пикселов пространственным смещением по горизонтали и вертикали. Ка- 
ждый пиксел на изображении (теоретически) отбирается в один и тот же момент 
времени. 


Видеоизображение представляет собой трехмерную информацию. Один из спосо- 
бов определения видеосегмента — это последовательность двумерных изображе- 
ний, следующих друг за другом через равные промежутки времени. Традиционные 
процессоры ОЗР оптимизированы для работы с двумерными данными одного изо- 
бражения, однако это не означает, что они оптимальны и для обработки последова- 
тельных изображений с высокой частотой обновления. 


В следующем разделе описываются графические процессоры, т.е. процессоры, 
специализированные для удовлетворения требований, связанных с синтезом и ото- 
бражением видео. 
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Обработка данных в графических процессорах 


Графический процессор — это цифровой процессор, оптимизированный для вы- 
полнения математических операций, связанных с генерированием и визуализацией 
графических изображений для их отображения на экране компьютера. Основными 
областями применения графических процессоров являются воспроизведение видео- 
записей и создание синтезированных изображений трехмерных сцен. 


Производительность графического процессора измеряется с учетом разрешения эк- 
рана (ширина и высота изображения в пикселах) и частоты обновления изображения 
в кадрах в секунду. Воспроизведение видео и визуализация сцен — это сложные 
процессы жесткого реального времени, в которых любое нарушение плавного и ре- 
гулярного обновления изображения через равные промежутки времени, скорее всего, 
будет воспринято пользователями как неприемлемое подвисание графики. 


Как и видеокамеры, которые мы упоминали ранее в этой главе, графические про- 
цессоры обычно представляют каждый пиксел с помощью трех 8-битных значений 
цвета, указывающих интенсивность красной, зеленой и синей составляющих. Лю- 
бой воспринимаемый цвет можно получить путем комбинирования соответствую- 
щих значений каждого из этих трех цветов. В каждом цветовом канале значение 0 
указывает на отсутствие цвета, а 255 — на максимальную интенсивность. Черный 
представлен тремя нулевыми значениями цвета (красный, зеленый, синий) = (0, 0, 0), 
а белый — (255, 255, 255). 24 бита цветовых данных дают возможность отобразить 
более 16 млн уникальных цветов. Степень отличия между соседними 24-битными 
значениями цвета, как правило, меньше, чем может различить человеческий глаз. 


В современных персональных компьютерах функции графического процессора 
доступны в различных конфигурациях: 


» графическая карта может быть установлена в разъем Ре; 


» система может содержать графический процессор в виде одной или несколь- 
ких отдельных интегральных схем на основной плате процессора; 


»е функции графического процессора могут быть встроены в интегральную 
схему центрального процессора. 


Самые мощные графические процессоры потребительского класса реализованы в 
виде карт расширения с интерфейсом РСГе. Эти высокопроизводительные графиче- 
ские процессоры содержат выделенную графическую память и имеют быстрый ка- 
нал связи с основным системным процессором (обычно с использованием разъема 
РЦе х16) для приема команд и данных, представляющих отображаемую сцену. Не- 
которые графические процессоры поддерживают использование нескольких иден- 
тичных карт в одной системе для создания сцен на одном графическом дисплее. 
Эта технология требует применения отдельной высокоскоростной шины, соеди- 
няющей графические процессоры друг с другом. Использование нескольких графи- 
ческих процессоров в системе обеспечивает эффективное распараллеливание гра- 
фической обработки. 
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Графические процессоры используют концепцию параллелизма данных для од- 
новременного выполнения идентичных вычислений над вектором элементов дан- 
ных, создавая соответствующий вектор выходных данных. Современные графиче- 
ские процессоры поддерживают тысячи одновременно выполняющихся потоков, 
реализуя возможность визуализации сложных трехмерных изображений, содержа- 
щих миллионы пикселов, со скоростью 60 кадров в секунду или более. 


Архитектура типичного графического процессора состоит из одного или несколь- 
ких многоядерных процессоров, каждый из которых поддерживает многопоточное 
выполнение алгоритмов параллельной обработки данных. Интерфейс между гра- 
фическими процессорами и графической памятью оптимизирован таким образом, 
чтобы обеспечить максимальную среднюю пропускную способность передачи дан- 
ных, а не свести к минимуму задержку доступа (что является целью проектирова- 
ния основной системной памяти). В графических процессорах допускается некото- 
рое увеличение задержки ради достижения максимальной скорости потоковой 
передачи данных между графическим процессором и его выделенной памятью, по- 
скольку максимальная пропускная способность обеспечивает достижение макси- 
мально возможной частоты обновления кадров. 


В компьютерных системах с менее жесткими требованиями к производительности 
графической обработки, таких как компьютеры бизнес-класса, более дешевым и час- 
то вполне приемлемым решением является интеграция менее производительного 
графического процессора в одну микросхему с основным процессором. Интегриро- 
ванные графические процессоры могут воспроизводить потоковое видео и реализуют 
в некоторой степени ограниченный уровень возможностей трехмерной визуализации 
сцен по сравнению с графическими процессорами более высокого класса. 


Вместо выделенной графической памяти интегрированные графические процессо- 
ры используют для визуализации графики часть системной памяти. Такой подход 
приводит к снижению производительности, однако подобные системы обеспечи- 
вают достаточную производительность обработки графики для решения большин- 
ства офисных и домашних задач. 


Интеллектуальные устройства, такие как мобильные телефоны и планшеты, также 
содержат графические процессоры, обеспечивающие те же возможности воспроиз- 
ведения видео и трехмерной визуализации сцен, что и более крупные персональные 
компьютерные системы. Требования компактности и пониженного энергопотреб- 
ления неизбежно ограничивают производительность графических процессоров мо- 
бильных устройств. Тем не менее современные смартфоны и планшеты в полной 
мере способны воспроизводить потоковое видео высокой четкости и отображать 


сложную игровую графику. 
Графические процессоры 
как процессоры обработки данных 


В течение многих лет архитектуры графических процессоров разрабатывались ис- 
ключительно для поддержки вычислительных потребностей визуализации трех- 
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мерных сцен в реальном времени. В последние годы пользователи и производители 
графических процессоров все чаще признают, что эти устройства на самом деле 
являются миниатюрными суперкомпьютерами, пригодными для решения гораздо 
более широкого спектра задач. Современные графические процессоры обеспечива- 
ют скорость выполнения операций с плавающей запятой, измеряемую триллионами 
операций с плавающей запятой в секунду (терафлопс). По состоянию на 2021 г. 
типичный высокопроизводительный графический процессор поддерживал произ- 
водительность операций с плавающей запятой на уровне десятков терафлопсов, 
и мог выполнять математические алгоритмы параллельной обработки данных в 
сотни раз быстрее, чем стандартный настольный компьютер. 


Используя преимущества огромной мощности параллельных вычислений, доступ- 
ной в высокопроизводительных графических процессорах, производители этих 
устройств предоставляют программные интерфейсы и расширенные аппаратные 
возможности для реализации более обобщенных алгоритмов. Безусловно, графиче- 
ские процессоры, даже с улучшениями для поддержки требований вычислений об- 
щего назначения, по-настоящему эффективны только при ускорении алгоритмов, 
которые предполагают распараллеливание обработки данных. 


Далее приведены некоторые области применения, которые оказались подходящими 
для ускорения операций с помощью графических процессоров. 


Большие данные 


В таких разноплановых сферах, как моделирование климата, картирование генов, 
бизнес-аналитика и анализ сейсмических данных, области решаемых проблем 
имеют общую потребность в максимально эффективном анализе огромных объе- 
мов данных, часто измеряемых в терабайтах (Тбайт) или петабайтах (Пбайт) 
(1 Пбайт = 1024 Тбайт). Во многих случаях алгоритмы такого анализа перебирают 
большие наборы данных в поисках тенденций, корреляций и более сложных связей 
между элементами данных, которые на первый взгляд могут показаться несопоста- 
вимыми и не связанными между собой массивами выборок. 


До недавнего времени анализ таких наборов данных при соответствующем уровне 
детализации часто отвергался как неосуществимый из-за слишком большого вре- 
мени, необходимого для выполнения такой обработки. Однако сегодня многие при- 
ложения для обработки больших данных дают результаты за вполне разумные пе- 
риоды времени, комбинируя использование графических процессоров (часто на 
машинах, содержащих несколько взаимосвязанных графических процессоров) 
и распределяя задачу между несколькими компьютерными системами в облачной 
среде. В наши дни использование нескольких компьютеров, каждый из которых 
содержит несколько графических процессоров, для выполнения алгоритмов с вы- 
сокой степенью параллелизма над огромным набором данных может потребовать 
удивительно низких затрат по сравнению с затратами, которые обычно связывают с 
суперкомпьютерами. 
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Глубокое обучение 


Глубокое обучение — это категория методов искусственного интеллекта (ИИ), ко- 
торая использует многоуровневые сети искусственных нейронов для моделирова- 
ния фундаментальных операций клеток человеческого мозга. Биологический ней- 
рон — это тип нервной клетки, которая обрабатывает информацию. Нейроны 
связаны между собой посредством синапсов и используют для обмена информаци- 
ей электрохимические импульсы. Во время обучения человеческий мозг настраива- 
ет связи между нейронами, чтобы кодировать усваиваемую информацию для по- 
следующего извлечения. Человеческий мозг содержит десятки миллиардов 
нейронов. 


Искусственные нейронные сети (асла| пеига] пебуогк, АММ)) используют про- 
граммную модель поведения нейронов для имитации процессов обучения и извле- 
чения информации, протекающих в человеческом мозге. Каждый искусственный 
нейрон получает входные данные от (возможно) многих других нейронов и вычис- 
ляет один числовой результат. Некоторые нейроны управляются непосредственно 
входными данными, подлежащими обработке, а другие производят выходные дан- 
ные, получаемые в результате вычислений АММ. Каждый канал связи между ней- 
ронами имеет связанный с ним весовой коэффициент, который представляет собой 
обычное число, умножающее силу сигнала, проходящего по этому пути. Выражен- 
ные в виде числа входные данные для нейрона — это сумма получаемых им вход- 
ных сигналов, каждый из которых умножен на вес соответствующего пути. 


Нейрон вычисляет выходной сигнал, используя формулу, называемую функцией 
активации. Она определяет степень влияния входных данных на "срабатывание" 
каждого нейрона. 


На рис. 6.4 представлен пример одного нейрона, который суммирует входные дан- 
ные от трех других нейронов (М-—М№), умножая их на весовые коэффициенты 
(и!-из). Полученная сумма передается в функцию активации Р(х), которая выраба- 
тывает выходной сигнал нейрона. 


Использование трех входных сигналов в этом примере является произвольным; 
в реальных задачах каждый нейрон может получать входные данные от любого ко- 
личества других нейронов. 


Рис. 6.4. Нейрон, получающий входные сигналы от трех других нейронов 
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ИНС имеет многоуровневую организацию, в которой за первым уровнем, называемым 
входным уровнем, следует один или несколько внутренних уровней (называемых 
скрытыми уровнями), после которых следует выходной уровень. Некоторые 
ИНС организованы в виде последовательности потоков данных, протекающих от 
входа к выходу. Сеть такой конфигурации называют сетью прямого распростра- 
нения. Другие конфигурации предусматривают обратную связь от некоторых ней- 
ронов к нейронам на предыдущих уровнях. Сеть такой конфигурации называют 
рекуррентной сетью. 


На рис. 6.5 показан пример простой сети прямого распространения с тремя вход- 
ными (три) нейронами, скрытым (В144еп) уровнем, состоящим из четырех нейро- 
нов, и двумя выходными (ошёри@ нейронами. Данная сеть является полносвязной. 
Это означает, что каждый нейрон на входном и скрытом уровнях связан со всеми 
нейронами на следующем уровне. Веса соединений на этой диаграмме не показаны. 


Рис. 6.5. Трехуровневая сеть прямого распространения 


Обучение ИНС состоит в настройке взвешенных связей между нейронами таким 
образом, чтобы при представлении определенного набора входных данных полу- 
чался желаемый результат. 


Применяя соответствующий алгоритм обучения, ИНС можно обучить с помощью 
набора данных, состоящего из известных заведомо правильных выходных данных 
для широкого спектра входных данных. 


Обучение большой и сложной ИНС выполнению сложной задачи, такой как управ- 
ление автомобилем или игра в шахматы, требует огромного количества обучающих 
итераций, взятых из очень большого набора данных. Во время обучения каждая 
итерация вносит небольшие корректировки в весовые коэффициенты внутри сети, 
постепенно приводя сеть в состояние конвергенции. После полной конвергенции 
сеть считается обученной и может быть использована для получения выходных 
данных при представлении новых входных данных. Другими словами, сеть обоб- 
щает информацию, которую она усвоила во время обучения, и применяет эти зна- 
ния к новым ситуациям. 
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Обработка на графическом процессоре очень хорошо подходит для ИНС благодаря 
их параллельному характеру. Человеческий мозг фактически представляет собой 
компьютер с миллиардами независимых процессорных блоков и массовым парал- 
лелизмом. Эта форма параллелизма используется на этапе обучения ИНС для уско- 
рения конвергенции сети путем параллельного выполнения вычислений, связанных 
с множеством искусственных нейронов. 


В следующем разделе будут представлены некоторые примеры типов компьютер- 
ных систем, реализованных на основе архитектурных концепций, которые были 
описаны в этой главе. 


Примеры специализированных архитектур 


В этом разделе рассматриваются некоторые конфигурации вычислительных сис- 
тем, специализированные для решения определенных задач, и выделяются особые 
требования к архитектуре, свойственные каждой из них. Мы рассмотрим следую- 
щие конфигурации. 


» Сервер для облачных вычислений. Несколько поставщиков предлагают 
клиентам доступ к вычислительным платформам через Интернет. Пользова- 
тели могут загружать программные приложения на соответствующий облач- 
ный сервер и выполнять любые виды вычислений по своему желанию. Как 
правило, эти сервисы выставляют счета своим клиентам на основании типа и 
количества выделенных вычислительных ресурсов и продолжительности их 
использования. Преимуществом для клиента является то, что за эти услуги не 
надо платить, когда они не используются. 


На более высоком уровне производительности клиенты могут использовать 
серверы, содержащие несколько соединенных друг с другом карт с графиче- 
скими процессорами, для выполнения крупномасштабных вычислений с ин- 
тенсивным использованием операций с плавающей запятой на огромных мас- 
сивах данных. В контексте облачных вычислений вполне естественным и 
часто экономически выгодным является подход с разбиением вычислитель- 
ных задач на более мелкие части, которые могут выполняться параллельно на 
нескольких серверах с графическими процессорами. 


Благодаря этому организации и даже частные лица с ограниченными финан- 
совыми возможностями могут использовать вычислительные ресурсы, кото- 
рые еще несколько лет назад были исключительной прерогативой правитель- 
ства, крупного бизнеса и исследовательских университетов, располагающих 
средствами для создания суперкомпьютеров. 


» Настольный компьютер бизнес-класса. Руководство отделов информаци- 
онных технологий коммерческих предприятий стремится обеспечить сотруд- 
ников вычислительными ресурсами, необходимыми для выполнения их рабо- 
ты, с наименьшими затратами. Большинству офисных работников не 
требуется исключительная графическая или вычислительная производитель- 
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ность, однако их компьютерные системы должны отвечать умеренным требо- 
ваниям по воспроизведению видеопрезентаций для таких целей, как обучение. 


Для бизнес-пользователей обычно более чем достаточно графического про- 
цессора, интегрированного с современным центральным процессором. За ра- 
зумную цену бизнес-покупатели могут приобрести компьютерные системы с 
процессорами среднего уровня производительности с интегрированным гра- 
фическим процессором. Подобные системы обеспечивают полную поддерж- 
ку современных операционных систем и стандартных офисных приложений, 
таких как текстовый редактор, электронная почта и электронные таблицы. 
Если возникнет потребность в расширении возможностей системы по обра- 
ботке графики, самый простой способ модернизации — установка карты гра- 
фического процессора в разъем расширения. 


е Высокопроизводительный игровой компьютер. Любителям новейших 
компьютерных ЗО-игр требуется графический процессор с высочайшим 
уровнем производительности для отображения детализированных сцен с вы- 
соким разрешением при максимально возможной частоте кадров. Эти поль- 
зователи готовы вложить свои средства в мощный, дорогостоящий, требую- 
щий мощного питания графический процессор (или даже несколько 
процессоров) для достижения максимально возможной графической произ- 
водительности. 


Не менее важной особенностью такого игрового компьютера, помимо мощ- 
ного графического процессора, является наличие быстрого системного про- 
цессора. Системный и графический процессоры работают совместно, исполь- 
зуя соединяющий их высокоскоростной интерфейс (обычно Ре х16) для 
вычисления положения и направления обзора наблюдателя сцены, а также 
типа, местоположения, визуальных характеристик и ориентации всех объек- 
тов в сцене. Системный процессор передает эту геометрическую информа- 
цию графическому процессору, который выполняет математические опера- 
ции, необходимые для создания реалистичного изображения на экране. Этот 
процесс повторяется с частотой, достаточной для плавного отображения 
сложных, быстро меняющихся сцен. 


е Смартфон высокого класса. Современные смартфоны сочетают высоко- 
производительные вычислительные возможности и высококачественные гра- 
фические дисплеи с жесткими ограничениями по энергопотреблению и теп- 
ловыделению. Пользователи требуют быстрой, плавной и яркой графики для 
игр и просмотра видео, но при том они не согласны мириться с малым време- 
нем автономной работы или сильным нагревом устройства. 


Дисплеи современных телефонов содержат миллионы полноцветных пиксе- 
лов, до 12 Гбайт оперативной памяти и до 1 Тбайт флеш-памяти. Эти уст- 
ройства обычно оснащаются двумя камерами высокого разрешения (перед- 
ней и задней), способными делать снимки и записывать видео. Телефоны 
высокого класса содержат 64-разрядный многоядерный процессор с интег- 
рированным графическим процессором, а также множество функций, обес- 
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печивающих оптимальное сочетание энергоэффективности и высокой про- 
изводительности. 


Архитектуры смартфонов содержат процессоры ОЗР для решения таких за- 
дач, как кодирование и декодирование голосовых аудиосигналов во время 
телефонных разговоров и обработка принимаемых и передаваемых радио- 
частотных сигналов, используемых различными приемопередатчиками те- 
лефона. Типичный телефон поддерживает цифровую сотовую связь, \/1-Е1, 
Вшеюо и ближнюю радиосвязь (пеаг-Не!4 соттитсайоп, МЕС). Совре- 
менные смартфоны — это мощные вычислительные платформы, оснащен- 
ные широким спектром средств связи и оптимизированные для работы от 
аккумулятора. 


В этом разделе мы рассмотрели архитектуры компьютерных систем, представляю- 
щие лишь малую часть современных и перспективных областей применения вы- 
числительной техники. Независимо от назначения компьютерной системы, будь то 
настольный офисный компьютер, смартфон или система управления пассажирским 
авиалайнером, в процессе ее проектирования и реализации применяется единый 
набор общих архитектурных принципов. 


Резюме 


В этой главе было рассмотрено несколько специализированных областей вычисле- 
ний, включая системы реального времени, цифровую обработку сигналов и обра- 
ботку графической информации. После прочтения этой главы у вас должно сло- 
житься более полное представление об особенностях современных компьютеров, 
включая работу в реальном времени, обработку аналоговых сигналов и графики в 
таких областях, как игры, голосовая связь, воспроизведение видео и использование 
графических процессоров в качестве миниатюрных суперкомпьютеров. Эти воз- 
можности являются важными расширениями основных вычислительных задач, вы- 
полняемых центральным процессором, будь то облачный сервер, настольный ком- 
пьютер или смартфон. 


В следующей главе мы обсудим современные процессорные архитектуры, в част- 
ности фон-неймановскую, гарвардскую и модифицированную гарвардскую. В ней 
будет рассмотрено использование виртуальной памяти со страничной организаци- 
ей, а также возможности и функции модуля управления памятью. 


Упражнения 


1. Частотно-монотонное планирование (ВМ5$) — это алгоритм назначения при- 
оритетов потокам в приложениях жесткого реального времени с вытеснением, 
в которых потоки выполняются периодически. 


КМ5 назначает наивысший приоритет потоку с самым коротким периодом вы- 
полнения, следующий по значимости приоритет — потоку со следующим наи- 
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более коротким периодом выполнения и т. д. Система КМ$ является диспетче- 
ризуемой, т.е. все ее задачи гарантированно укладываются в установленные 
сроки (при условии, что межпоточные взаимодействия или другие действия, та- 
кие как прерывания, не вызывают задержек обработки), если выполняется сле- 
дующее условие: 


У“ <и(2% -1) 


11 2; 


Эта формула выражает максимальную долю доступного времени обработки, 
которое может быть потрачено п потоками. В этой формуле С; — это макси- 
мальное время выполнения, необходимое для потока 1, а Т; — период выполне- 
ния потока г. 


Является ли следующая система, состоящая из трех потоков, диспетчеризуемой? 


Период выполнения Т, мс 
О Е п О зи 


2. Широко используемая форма одномерного дискретного косинусного преобра- 
зования (ДКП) выражается следующей формулой: 


у М-1 дл 1 р 
= Х. 0$ —| И+— . 
Г >. п М 2 


В этой формуле А, индекс коэффициента ДКП, меняется от 0 до №М- 1. Напиши- 
те программу для вычисления ДКП такой последовательности: 


х = {0.5, 0.2, 0.7, -0.6, 0.4, -0.2, 1.60, -0.3}. 


Косинусные члены в формуле зависят только от индексов и и Ки не зависят от 
последовательности входных данных х. Это означает, что косинусные члены 
можно вычислить один раз и сохранить в виде констант для последующего ис- 
пользования. Если сделать это в качестве подготовительного этапа, то вычисле- 
ние каждого коэффициента ДКП сводится к последовательности операций 
МАС. 


Эта формула представляет собой неоптимизированную форму вычисления 
ДКП, требующую № итераций операции МАС для вычисления всех коэффици- 
ентов ДКП в количестве №. 


5. В качестве функции активации в ИНС часто используется гиперболический 
тангенс. Его функция определяется следующим образом: 


ег -е* 
Е: 
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Дан нейрон с входами от трех предшествующих нейронов, показанный на 
рис. 6.4. Вычислите выходной сигнал нейрона с гиперболическим тангенсом в 
качестве функции активации Р(х), используя следующие выходные сигналы 
предшествующих нейронов и веса соответствующих путей: 


Архитектура процессора и памяти 


В этой главе более подробно рассматриваются архитектуры современных процес- 
соров, в частности фон-неймановская, гарвардская и модифицированная гарвард- 
ская, а также области вычислений, в которых, как правило, применяется каждая из 
этих архитектур. Представлены концепции и преимущества виртуальной памяти со 
страничной организацией, широко используемой в вычислительных платформах 
потребительского и коммерческого назначения, а также в мобильных устройствах. 
Мы рассмотрим практические детали управления памятью на примере реальных 
систем — У/штдо\$ МТ и более поздних версий \Итдо\з. Глава завершается обсу- 
ждением особенностей и функций блока управления памятью. 


После прочтения этой главы вы получите представление о ключевых особенностях 
архитектур современных процессоров и использовании физической и виртуальной 
памяти. Вы также ознакомитесь с преимуществами страничной организации памя- 
ти и функциями блока управления памятью. 


В этой главе рассматриваются следующие темы: 
» фон-неймановская, гарвардская и модифицированная гарвардская архитектуры; 
» физическая и виртуальная память; 
® виртуальная память со страничной организацией; 


е блок управления памятью. 


Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 
В рз://2ИВиБ.сот/РаскЕРи 6$ тр/Модегп-Сотршег-АтсВНесиге-апд- 
Ограттайоп-Зесопд-ЕЧЁ оп. 
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Фон-неймановская, гарвардская 
и модифицированная гарвардская архитектуры 


В предыдущих главах мы кратко коснулись истории и современных областей при- 
менения процессорных архитектур — фон-неймановской, гарвардской и модифи- 
цированной гарвардской. .В этом разделе мы рассмотрим эти конфигурации более 
подробно и изучим области вычислений, в которых обычно применяется каждая из 
указанных архитектур. 


Фон-неймановская архитектура 


Архитектура, получившая название фон-неймановской, была представлена Джоном 
фон Нейманом в 1945 г. Эта процессорная конфигурация состоит из устройства 
управления, арифметико-логического устройства (АЛУ), набора регистров и облас- 
ти памяти, содержащей программные инструкции и данные. Ключевая особен- 
ность, отличающая фон-неймановскую архитектуру от гарвардской, заключается в 
использовании единой области памяти для программных инструкций и данных, 
с которыми работают инструкции. Программистам принципиально просто, а разра- 
ботчикам схем относительно проще разместить весь код и все данные, необходи- 
мые программе, в одной области памяти. 


На рис. 7.1 показаны элементы фон-неймановской архитектуры. 


Процессор 


Устройство 
управления 


Устройство 
ввода-вывода 


Устройство 
ввода-вывода 


Регистры 


Рис. 7.1. Фон-неймановская архитектура 


Архитектурный подход с единой памятью упростил проектирование и изготовле- 
ние процессоров и компьютеров первых поколений, однако использование общей 
памяти для программ и данных создало определенные проблемы, связанные с про- 
изводительностью систем и, в последние годы, с их безопасностью. 
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Вот некоторые из наиболее существенных проблем. 


» Узкое место архитектуры фон Неймана. Использование единого интерфей- 
са между процессором и основной памятью для доступа к инструкциям и 
данным часто требует нескольких циклов памяти для извлечения инструкции 
процессора и доступа к требуемым данным. Если непосредственное значение 
хранится рядом с опкодом инструкции, снижение производительности из-за 
узкого места может быть незначительным или вообще отсутствовать, по- 
скольку, по крайней мере в некоторых случаях, непосредственное значение 
загружается вместе с опкодом за один цикл доступа к памяти. Однако боль- 
шинство программ тратят значительную часть своего времени на работу с 
данными, хранящимися в выделенной области памяти отдельно от программ- 
ных инструкций. В такой ситуации для извлечения опкода и любых необхо- 
димых элементов данных требуется несколько операций доступа к памяти. 


Использование кеш-памяти для программных инструкций и данных, которое 
подробно рассматривается в главе 8, может значительно смягчить это огра- 
ничение. Однако при работе с последовательностями инструкций и объекта- 
ми данных, размер которых превышает объем кеш-памяти, преимущество 
кеширования уменьшается и, вероятно, даже на значительную величину. Не- 
возможно избежать того факта, что размещение кода и данных в одной и той 
же области памяти с общим каналом обмена данными с процессором иногда 
будет ограничивать производительность системы. 


е Аспекты безопасности фон-неймановской архитектуры. Использование 
единой области памяти для кода и данных открывает творческим программи- 
стам возможность хранить последовательности инструкций в памяти под ви- 
дом данных, а затем отправлять эти инструкции в процессор на выполнение. 
Программы, которые записывают код в память, а затем выполняют его, реа- 
лизуют самомодифицирующийся код. Помимо сложности поиска и устра- 
нения ошибок (поскольку многие средства отладки программного обеспече- 
ния основаны на предположении, что программа в памяти содержит все 
инструкции, которые были изначально собраны в нее при компиляции), эта 
возможность годами использовалась хакерами в злонамеренных целях. 


» Переполнение буфера — удручающе распространенный недостаток в широ- 
ко используемых программных решениях, таких как операционные системы, 
веб-серверы и базы данных. Переполнение буфера происходит, когда про- 
грамма запрашивает входные данные и сохраняет их в буфере данных фикси- 
рованной длины. Если в коде не предусмотрена проверка длины вводимых 
данных, то пользователь может ввести последовательность, длина которой 
превышает доступное пространство для хранения. Когда это происходит, до- 
полнительные данные перезаписывают содержимое ячеек памяти, предназна- 
ченных для других целей. 


Если перезаписываемый буфер хранится в стеке программы, то изобрета- 
тельный пользователь может ввести длинную последовательность, способ- 
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ную перезаписать адрес возврата выполняемой в данный момент функции, 
который может храниться в том же стеке. 


Тщательно продумав содержимое вводимой последовательности, злоумыш- 
ленник может перехватить управление исполняемым приложением и напра- 
вить его на выполнение любой желаемой последовательности инструкций. 
Для этого хакер должен подготовить последовательность, которая перепол- 
няет буфер ввода, перезаписывает адрес возврата функции другим, тщательно 
подобранным адресом и записывает в память последовательность инструк- 
ций, выполнение которой запускается по этому адресу. Последовательность 
инструкций, введенная злоумышленником, начинает выполняться, когда 
функция, которая первоначально запрашивала пользовательский ввод, осу- 
ществляет возврат, передавая управление коду хакера. Это позволяет хакеру 
"завладеть" компьютером. 


На протяжении многих лет различные попытки решить проблему переполнения 
буфера отнимали огромное количество времени у исследователей компьютерной 
безопасности, начиная с первого случая широкого распространения атаки такого 
типа в 1988 г. Изготовители процессоров и разработчики операционных систем 
внедрили множество функций для борьбы с атаками переполнения буфера. Среди 
них решения с такими названиями, как предотвращение выполнения данных 
(аа ехесийоп ргеуепйоп, РЕР) и случайное распределение адресного простран- 
ства (а44гез$ зрасе |ауоц{ гапдопитаноп, АЗГВ). Эти исправления продемонстриро- 
вали некоторую степень эффективности, однако фундаментальной особенностью 
процессора, которая создает возможность злоупотреблений такого типа, является 
использование одной и той же области памяти для программных инструкций и 
данных в фон-неймановской архитектуре. 


Гарвардская архитектура 


Гарвардская архитектура была первоначально реализована в компьютере Нагуаг4 
Ма!К [в 1944 г. В строгой гарвардской архитектуре для программных инструкций и 
для данных отведены отдельные адресные пространства и шины доступа к памяти. 
Непосредственным преимуществом такой конфигурации является возможность од- 
новременного доступа к инструкциям и к данным, что позволяет реализовать опре- 
деленную форму параллелизма. Конечно, это улучшение достигается за счет суще- 
ственного дублирования количества адресных строк, линий передачи данных и 
управляющих сигналов, которые должны быть реализованы в процессоре для дос- 
тупа к обеим областям памяти. 


На рис. 7.2 показана схема процессора, реализующего гарвардскую архитектуру. 


Гарвардская архитектура может обеспечить более высокий уровень производитель- 
ности за счет распараллеливания доступа к инструкциям и данным. Эта архитекту- 
ра также устраняет весь класс проблем безопасности, связанных со злонамеренным 
выполнением программных инструкций, скрытых под видом данных, при условии, 
что память инструкций не может быть изменена программными инструкциями. 
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Данный подход предполагает, что память программ загружена инструкциями над- 
лежащим образом. 
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Рис. 7.2. Гарвардская архитектура 


Если оглянуться назад, располагая знанием о распространении угроз безопасности, 
основанных на особенностях архитектуры фон Неймана, то есть повод задуматься, 
не было бы значительно лучше для всей отрасли информационных технологий, ес- 
ли бы еще на ранних этапах было достигнуто соглашение о внедрении гарвардской 
архитектуры с полным разделением областей памяти кода и данных, несмотря на 
связанные с этим затраты. 


На практике строгая гарвардская архитектура редко применяется в современных 
компьютерах. Обычно используется несколько вариантов гарвардской архитекту- 
ры, которые в совокупности называются модифицированными гарвардскими 
архитектурами. Эти архитектуры являются темой следующего раздела. 


Модифицированная гарвардская архитектура 


В компьютерах, разработанных на основе модифицированной гарвардской архи- 
тектуры, реализована, как правило, некоторая степень разделения между про- 
граммными инструкциями и данными. Это снижает влияние узкого места архитек- 
туры фон Неймана и позволяет устранить некоторые проблемы безопасности, 
о которых мы уже говорили. Однако разделение между инструкциями и данными 
редко бывает абсолютным. В системах с модифицированной гарвардской архитек- 
турой используются отдельные области памяти программных инструкций и памяти 
данных, но эти процессоры обычно поддерживают некоторые средства для сохра- 
нения данных в памяти программ и, в отдельных случаях, для сохранения инструк- 
ций в памяти данных. 


На рис. 7.3 показана модифицированная гарвардская архитектура, представляющая 
многие реальные компьютерные системы. 


Как мы видели в предыдущей главе, процессоры цифровой обработки сигналов 
(41ра] 12па| ргосез5ог$, ОЗР) получают значительные преимущества от использо- 
вания архитектуры, подобной гарвардской. 
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Рис. 7.3. Модифицированная гарвардская архитектура 


Сохраняя один числовой вектор в памяти инструкций и второй вектор — в памяти 
данных, ОЗР может выполнить одну операцию умножения с накоплением 
(ши@ру асситшае, МАС) за один тактовый цикл процессора. В этих системах об- 
ласть памяти инструкций и содержащиеся в ней элементы данных обычно доступ- 
ны только для чтения. На это указывает однонаправленная стрелка, соединяющая 
память инструкций с процессором на рис. 7.3. Поэтому для сохранения в области 
памяти инструкций подходят только значения постоянных данных. 


Помимо ВЗР, большинство современных процессоров общего назначения содержат 
отдельные области кеш-памяти для инструкций и данных, реализуя тем самым 
важные особенности гарвардской архитектуры. Такие процессорные архитектуры, 
как х86 и АКМ, поддерживают параллельный и независимый доступ к инструкциям 
и данным, когда запрашиваемые элементы находятся на первом уровне кеш- 
памяти. Если поиск во встроенной кеш-памяти не увенчался успехом, процессор 
должен обратиться к основной памяти по общей фон-неймановской шине, что за- 
нимает значительно больше времени. 


На практике детали реализации конкретного процессора с точки зрения особенно- 
стей фон-неймановской и гарвардской архитектур редко имеют значение для раз- 
работчиков программного обеспечения, за исключением соображений производи- 
тельности. Программисты обычно разрабатывают программы на выбранном ими 
языке высокого уровня, а детали операций, связанные с распределением данных и 
инструкций по соответствующим областям памяти, реализует компилятор или ин- 
терпретатор. 


В следующем разделе обсуждаются преимущества виртуализации памяти. 


Физическая и виртуальная память 


Устройства памяти в компьютерах можно разделить на устройства оперативной 
памяти (оперативное запоминающее устройство, ОЗУ — гап4от ассез5 шетоту, 
ВАМ), чтение из которых и запись в которые выполняются произвольно, и устрой- 
ства постоянной памяти (постоянного запоминающего устройства, ПЗУ — геад- 
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ошу тетогу, КОМ), данные из которых, как следует из их названия, можно только 
считывать, но не записывать. Некоторые типы устройств памяти, такие как флеш- 
память и электрически стираемое программируемое постоянное запоминающее 
устройство (ЭСППЗУ), представляют золотую середину, когда содержимое уст- 
ройств может быть изменено, но не так легко или не так быстро или не так много 
раз, как в случае обычной оперативной памяти. 


Устройства памяти в компьютере должны быть настроены таким образом, чтобы 
гарантировать, что каждое устройство занимает уникальный участок системного 
адресного пространства, чтобы процессор мог получать доступ к каждому из (воз- 
можно) нескольких ОЗУ и ПЗУ путем выбора соответствующих адресных строк. 
Современные компьютерные системы обычно выполняют такое распределение ад- 
ресного пространства автоматически, основываясь на разъеме, в который установ- 
лено устройство памяти. 


Программное обеспечение, работающее на ранних компьютерных системах, а так- 
же на относительно несложных современных компьютерах и встраиваемых процес- 
сорах (таких как системы на базе 6502), для выполнения операций чтения и записи 
использует в программных инструкциях адреса в ОЗУ и ПЗУ. 


Например, такая инструкция процессора 6502, как ЭМР $1000, предписывает процес- 
сору загрузить в указатель инструкций шестнадцатеричное значение $1000 и выпол- 
нить инструкцию в этой ячейке памяти. При обработке этой инструкции устройство 
управления процессора 6502 помещает значение $1000 на 16 адресных строк про- 
цессора и считывает байт по соответствующему адресу памяти. Этот байт интер- 
претируется как опкод следующей инструкции, которая должна быть выполнена. 
Аналогичным образом, загрузка байта из памяти с помощью такой инструкции, как 
ГРА $0200, помещает значение $02600 на адресные строки и копирует байт, хранящий- 
ся по этому адресу, в регистр А. 


В системах, использующих физическую адресацию, адреса памяти в инструкциях 
являются фактическими адресами указанной инструкции или элемента данных. Это 
означает, что адрес памяти, содержащийся в инструкции, является тем же самым 
адресом, который используется для электрического доступа к соответствующей 
ячейке в устройстве памяти. 


Этот архитектурный подход концептуально прост для реализации в процессорах, 
но в сценарии, включающем несколько одновременно выполняющихся программ 
(который называют мультирограммным режимом), сложность разработки про- 
граммного обеспечения может быстро стать чрезмерной. Если каждая из несколь- 
ких программ разрабатывается изолированно от других (например, в случае с не- 
сколькими независимыми разработчиками), должен быть какой-то способ 
распределения доступных адресных пространств ОЗУ и ПЗУ для отдельных про- 
грамм, чтобы гарантировать одновременное выполнение нескольких программ 
(возможно, в контексте ОСРВ) без взаимных конфликтов при доступе к памяти. 


Одной из хорошо известных ранних попыток поддержки выполнения нескольких 
программ в одном адресном пространстве на ПК является реализованная в опера- 
ционной системе М5-ООЗ концепция резидентной программы (егпшае ап4 ау 


214 Глава 7 


гез1деть, ТЗК). Резидентные программы резервируют область памяти и загружают в 
нее свой код, а затем возвращают управление операционной системе. Пользователи 
могут продолжать работать с системой в обычном режиме, загружая и используя 
другие приложения (по одному, конечно), но они также могут получить доступ к 
резидентной программе по мере необходимости, обычно с помощью специальной 
комбинации клавиш. Можно одновременно загрузить в память несколько рези- 
дентных программ, доступ к каждой из которых может осуществляться с помощью 
отдельной комбинации клавиш. После вызова резидентной программы пользова- 
тель взаимодействует с ней по мере необходимости, затем выполняет команду ТЭК 
для возвращения к запущенному в данный момент основному приложению. 


Несмотря на ограничения во многих отношениях (в том числе потребление части 
оперативной памяти максимальным объемом 640 Кбайт, доступное на ранних ПК), 
резидентные программы фактически позволяли запускать несколько программ в 
едином адресном пространстве ОЗУ. 


Разработка резидентных программ была сложной задачей. Более продвинутые ре- 
зидентные программы, доступные в 1980-х и 1990-х годах, использовали недоку- 
ментированные функции М$-ОО$, чтобы обеспечить максимум возможностей для 
своих пользователей. 


В результате таких сложностей резидентные программы приобрели репутацию вы- 
зывающих нестабильность системы. Было очевидно, что необходим другой подход 
к поддержке мультипрограммного режима. 


Использование виртуальной памяти помогло преодолеть наиболее сложные про- 
блемы, которые препятствовали широкому применению мультипрограммного ре- 
жима в оригинальных ПК. Виртуальная память — это метод управления памятью, 
позволяющий каждому приложению работать в собственном пространстве памяти, 
внешне независимо от любых других приложений, которые могут одновременно 
находиться в запущенном состоянии в одной системе. На компьютере с системой 
управления виртуальной памятью операционная система отвечает за выделение 
физической памяти системным процессам и пользовательским приложениям. Ап- 
паратные средства и программное обеспечение для управления памятью преобра- 
зуют запросы к памяти, исходящие из контекста виртуальной памяти приложения, 
в адреса физической памяти. 


Помимо упрощения процесса разработки и запуска параллельных приложений, 
виртуальная память также позволяет выделять больший объем памяти, чем имеется 
в компьютере. Это достигается за счет использования вспомогательного хранилища 
(обычно файла на диске) для временного хранения копий разделов памяти, удаляе- 
мых из физической памяти, чтобы другая программа (или другая часть той же про- 
граммы) могла запуститься в освободившейся памяти. 


В современных компьютерах общего назначения разделы памяти обычно выделя- 
ются и перемещаются в количестве, кратном фрагменту фиксированного размера, 
называемому страницей. Страницы памяти, как правило, имеют размер 4 Кбайт 
или больше. Перемещение страниц памяти во вспомогательное хранилище и из не- 


Архитектура процессора и памяти 215 


го в системах виртуальной памяти называется подкачкой страниц. Файл, содер- 
жащий замененные страницы, является файлом подкачки. 


В системе с управлением виртуальной памятью ни разработчикам приложений, ни 
самому коду не нужно заботиться о том, сколько других приложений запущено в 
системе или насколько заполнена физическая память. По мере того, как приложе- 
ние резервирует память для массивов данных и выполняет вызовы библиотечных 
подпрограмм (для чего требуется загрузка кода для этих подпрограмм в память), 
операционная система управляет распределением физической памяти и предпри- 
нимает необходимые действия для того, чтобы каждое приложение получало па- 
мять по запросу. Только в маловероятном случае полного заполнения доступной 
физической памяти при одновременном достижении предельного размера файла 
подкачки система вынуждена возвращать код ошибки в ответ на запрос о выделе- 
нии памяти. 


Помимо упрощения работы программистов виртуальная память предоставляет ряд 
других важных преимуществ. 


е Приложения могут игнорировать присутствие друг друга, а также не могут 
вмешиваться, случайно или намеренно, в работу друг друга. Аппаратные 
средства управления виртуальной памятью гарантируют, что каждое прило- 
жение получает доступ только к тем страницам памяти, которые были ему 
назначены. 


Попытки получить доступ к памяти другого процесса или к любому другому 
адресу за пределами выделенного приложению пространства памяти приво- 
дят к появлению исключения, вызванного нарушением прав доступа. 


»е Каждая страница памяти имеет набор атрибутов, которые ограничивают под- 
держиваемые ею типы операций. Страница может быть помечена как доступ- 
ная только для чтения, что исключает любые попытки записи данных в нее. 
Страница может быть помечена как исполняемая — это означает, что она со- 
держит код, который может быть выполнен в виде инструкций процессора. 
Страница может быть помечена как доступная для чтения и записи — такие 
страницы приложение может изменять по своему усмотрению. Устанавливая 
эти атрибуты надлежащим образом, операционные системы могут повысить 
стабильность системы, гарантируя невозможность внесения изменений в ин- 
струкции процессора и выполнения данных в виде инструкций независимо от 
того, является ли такая попытка результатом случайности или злого умысла. 


е Страницам памяти может быть назначен лишь минимально необходимый 
уровень привилегий, что позволяет разрешить доступ к таким страницам 
только коду, запущенному с привилегиями ядра. Это ограничение гарантиру- 
ет, что операционная система продолжит работать должным образом даже 
при наличии неправильно работающих приложений. Благодаря этому сис- 
темную память можно отображать в адресное пространство каждого процес- 
са, запрещая коду приложения напрямую взаимодействовать с этой памятью. 
Приложения могут обращаться к системной памяти только косвенно, через 
программный интерфейс, реализующий системные вызовы. 
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® Страницы памяти могут быть помечены для совместного использования при- 
ложениями. Это означает, что к такой странице может быть явно разрешен 
доступ более чем из одного процесса. Это обеспечивает эффективное взаи- 
модействие между процессами. 


В ранних версиях М!сгозой \Мшдо\$ были реализованы некоторые функции вир- 
туализации памяти с использованием возможностей сегментации памяти процессо- 
ров 80286 и 80386. В контексте \Мт4о\з использование виртуальной памяти окон- 
чательно оформилось с выпуском \Мшдо\з МТ 3.1 в 1993 г. Архитектура системы 
\УИпдо\$ МТ была основана на архитектуре Уйиа! АЗ@гез$ еХ{епяоп (УАХ), раз- 
работанной корпорацией П1ейа! Едиртеп Согрогайоп в 1970-х годах. В этой архи- 
тектуре была реализована 32-разрядная среда виртуальной памяти с виртуальным 
адресным пространством объемом 4 Гбайт, доступным для каждого из потенциаль- 
но многих приложений, работающих в контексте мультипрограммного режима. 
Одним из основных архитекторов операционной системы УАХ (уйиа| шетогу 
зубет, УМ5$), был Дэвид Катлер (Бама Си|ег), который позже возглавил разра- 
ботку Мисгозой \/тдо\з$ МТ. 


У/Лтдо\$ МТ имеет плоскую 32-разрядную организацию памяти. Это означает воз- 
можность прямого доступа к любому адресу во всем 32-разрядном пространстве с 
использованием 32-разрядного адреса. Для манипулирования сегментными регист- 
рами не требуется никаких дополнительных усилий программиста. По умолчанию 
виртуальное адресное пространство \У/тдо\з МТ разделено на два блока равного 
размера: пользовательское адресное пространство объемом 2 Гбайт в нижней поло- 
вине диапазона и пространство ядра объемом 2 Гбайт в его верхней половине. 


Следующий раздел посвящен виртуальной памяти со страничной организацией в 
32-разрядной операционной системе \Утдо\з$ МТ на процессорах Пе. У/тдо\$ 
МТ не в полной мере отражает реализацию виртуальной памяти в других операци- 
онных системах, однако в ней применены аналогичные принципы, а другие среды 
отличаются лишь в деталях. Это введение дает представление о концепциях вирту- 
альной памяти, оставляя дополнительные подробности, связанные с более совре- 
менными архитектурами, такими как 64-разрядные процессоры и операционные 
системы, для последующих глав. 


Виртуальная память со страничной организацией 


В 32-разрядной ОС \У/тао\’$ МТ на процессорах [| страницы памяти имеют размер 
4 Кбайт. Это означает, что для адресации ячейки на конкретной странице требуется 
12-битный адрес (т. к. 21? = 4096). Оставшиеся 20 бит 32-разрядного виртуального 
адреса используются в процессе преобразования (трансляции) виртуального адреса 
в физический. 


В \Утдо\$ МТ все адреса памяти в программе (указанные как в исходном коде, так 
и в скомпилированном исполняемом коде) являются виртуальными адресами. Они 
не связаны с физическими адресами до тех пор, пока программа не будет запущена 
под управлением блока управления памятью. 
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Непрерывный раздел физической памяти размером 4 Кбайт в \Утдо\/$ МТ называ- 
ют страничным кадром. Это наименьшая единица памяти, управляемая системой 
виртуальной памяти У пдожз. Каждый страничный кадр начинается с границы в 
4 Кбайт. Это означает, что в начале любого страничного кадра все младшие 12 бит 
адреса равны нулю. Система отслеживает информацию, связанную со страничными 
кадрами, с помощью таблиц страниц. 


Размер таблицы страниц в \/т4до\/$ МТ подобран таким образом, чтобы она зани- 
мала одну страницу размером 4 Кбайт. Каждая 4-байтовая запись в таблице стра- 
ниц позволяет транслировать 32-разрядный адрес из виртуального адресного про- 
странства, используемого программными структурами, в физический адрес, 
необходимый для доступа к ячейке памяти в ОЗУ или ПЗУ. Таблица страниц раз- 
мером 4 Кбайт содержит 1024 записи трансляции адресов страниц. Одна таблица 
страниц управляет доступом к 4 Мбайт адресного пространства: умножаем 1024 
страничных кадра каждой таблицы на 4 Кбайт для каждой страницы. Процесс мо- 
жет иметь несколько связанных с ним таблиц страниц, а управление всеми этими 
таблицами осуществляется с помощью каталога таблиц страниц. 


Каталог таблиц страниц представляет собой страницу размером 4 Кбайт, содер- 
жащую серию 4-байтовых ссылок на таблицы страниц. Каталог таблиц страниц 
может содержать 1024 ссылки на таблицы страниц. Один каталог таблиц страниц 
охватывает все 4 Гбайт адресного пространства 32-разрядной ОС \Мтдо\з$ МТ (ум- 
ножаем 4 Мбайт для каждой таблицы страниц на 1024 ссылки на таблицы страниц). 


Каждый процесс У/тдо\з$ МТ имеет отдельный каталог таблиц страниц, набор 
таблиц страниц и набор страничных кадров, выделенных для использования этим 
процессом. Таблицы страниц процесса применимы ко всем потокам процесса, по- 
скольку все потоки процесса совместно используют одно и то же адресное про- 
странство и распределение памяти. 


Когда системный планировщик переключается с одного процесса на другой, КОН- 
текст виртуальной памяти входящего процесса заменяет контекст исходящего про- 
цесса. 


Процессоры ше! х86 поддерживают адрес текущего каталога таблиц страниц про- 
цесса в регистре Св3, также известном как базовый регистр каталога страниц 
(раре Чпесюгу Базе герлуег, РОВК). Это точка входа в каталог таблиц страниц и 
таблицы страниц, с помощью которой процессор может преобразовать любой дей- 
ствительный виртуальный адрес в соответствующий физический адрес. 


Обращаясь к произвольной (допустимой) ячейке памяти и предполагая, что инфор- 
мация, которая могла бы ускорить доступ, еще не сохранена в кеше недавних 
трансляций виртуального адреса в физический, процессор сначала ищет физиче- 
ский адрес соответствующей таблицы страниц в каталоге таблиц страниц, исполь- 
зуя старшие 10 бит виртуального адреса. Затем он обращается к нужной таблице 
страниц и использует следующие по значению 10 бит адреса для выбора физиче- 
ской страницы, содержащей запрошенные данные. После этого младшие 12 бит 
адреса указывают в страничном кадре ячейку памяти, запрошенную исполняемой 
инструкцией. 


218 Глава 7 


СТРАНИЧНЫЕ КАДРЫ НЕ ОТРАЖАЮТ ДЕЙСТВИТЕЛЬНЫЕ 
РАЗДЕЛЫ ФИЗИЧЕСКОЙ ПАМЯТИ 


и Физическая память на самом деле не разделена на страничные кадры. 

\=> Структура страницы — это лишь метод, используемый системой для 
отслеживания информации, необходимой для трансляции виртуальных 
адресов в адреса ячеек физической памяти. 


Для того чтобы соответствовать ожиданиям пользователей в отношении произво- 
дительности, каждое обращение к памяти должно быть как можно более быстрым. 
Во время выполнения каждой инструкции для извлечения кодов операций инст- 
рукций и данных выполняется по крайней мере одно преобразование виртуального 
адреса в физический. Из-за высокой частоты повторения этого процесса разработ- 
чики процессоров прилагают значительные усилия для достижения максимальной 
эффективности трансляции виртуальных адресов. 


В современных процессорах в кеше трансляций сохраняются результаты недавних 
поисков для трансляции адресов виртуальной памяти. Такой подход позволяет вы- 
полнять весьма значительную долю трансляций адресов виртуальной памяти внут- 
ри процессора без дополнительных тактовых циклов, которые потребовались бы, 
если бы процессору необходимо было сначала осуществить поиск адреса таблицы 
страниц в каталоге таблиц страниц, а затем получить доступ к таблице страниц для 
определения запрошенного физического адреса. 


Структуры данных, используемые при трансляции виртуального адреса в физиче- 
ский, недоступны приложениям, работающим на уровне привилегий пользователя. 
Все действия, связанные с трансляцией адресов, выполняются в аппаратных сред- 
ствах процессора и в программных процессах, работающих в режиме ядра. 


Для того чтобы прояснить процедуру трансляции виртуальных адресов, на рис. 7.4 
представлен пример трансляции 32-разрядного виртуального адреса в физический в 
ОС УЛпдо\5. 


Рассмотрим процесс трансляции, представленный на рис. 7.4, шаг за шагом. Пред- 
положим, что процессор запрашивает 8-битное значение данных, хранящееся по 
виртуальному адресу $00462003, с помощью инструкции то\ма1 , [ебх], при этом в ре- 
гистр ебх ранее было загружено значение $00492003. Также предположим, что дан- 
ные трансляции этого адреса еще не были сохранены в кеше недавних трансляций 
виртуального адреса в физический и страница находится в основной памяти. Про- 
цесс трансляции описывает следующая процедура. 


1. Процессор пытается выполнить инструкцию пома1 , [ебх], но он не может сделать 
это, поскольку у него нет непосредственного доступа к информации, необходи- 
мой для трансляции виртуального адреса, хранящегося в ебх, в соответствую- 
щий физический адрес. Эта ситуация порождает исключение "отказ страни- 
цы", в результате управление передается операционной системе, чтобы она 
могла разрешить проблему с трансляцией адреса. В данном случае использова- 
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ние термина "отказ" не означает, что произошла какая-то ошибка. Отказы 
страниц — это обычная составляющая выполнения приложения. 


Номер бита: 31 22 21 12 11 0 
32-битный 
$ Смещение | Смещение | Смещение 
виртуальный 
каталога таблицы кадра 
адрес: 


00 0000 0001 00 0000 0010 00 0000 0011 


500402003 


Регистр СВЗ 


Каталог 
страниц 


Таблица Страничный 
страниц кадр 


Смещение 1023 Смещение 1023 Байт 4095 


Рис. 7.4. Трансляция виртуального адреса в физический 


2. Запрошенный виртуальный адрес сдвигается вправо на 22 битовые позиции, 
оставляя 10-битное смещение каталога, которое в этом примере имеет значение 1. 


3. Смещение каталога сдвигается влево на 2 битовые позиции (поскольку каждая 
запись в каталоге страниц составляет 4 байта) и добавляется к содержимому ре- 
гистра скз процессора (базовый регистр каталога страниц). Результатом являет- 
ся адрес записи в каталоге таблиц страниц, содержащей адрес соответствующей 
таблицы страниц. 


4. Запрошенный виртуальный адрес сдвигается вправо на 12 битовых позиций и 
маскируется, чтобы осталось только 10-битное смещение таблицы, которое в 
этом примере имеет значение 2. 


к Смещение таблицы сдвигается влево на 2 битовых ПОЗИЦИИ (поскольку каждая 
запись в этой таблице также имеет длину 4 байта) и добавляется к адресу таб- 
лицы страниц, указанному на шаге 3. 32-разрядный адрес, считываемый из этой 
ячейки, является физическим адресом кадра страницы, содержащего запрошен- 
ные данные. 


6. Процессор сохраняет данные трансляции, которая представляет собой преобра- 
зование старших 20 битов виртуального адреса в соответствующие старшие 
20 битов адреса страничного кадра, в своем кеше трансляций. 


7. Процессор снова пытается выполнить инструкцию поуа1, [ебх], которая теперь 
успешно перемещает запрошенный байт данных в регистр а1, используя поме- 
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щенные в кеш данные трансляции виртуального адреса в физический. Для дос- 
тупа к запрошенному байту младшие 12 бит виртуального адреса (смещение 
кадра), содержащие значение 3 в данном примере, добавляются к адресу кадра 
страницы, вычисленному на шаге 5. 


После завершения этих действий трансляция для запрошенного страничного кадра 
в течение некоторого времени остается доступной в кеш-памяти трансляций про- 
цессора. Пока данные трансляции остаются в кеше, последующие запросы того же 
виртуального адреса или других ячеек в том же страничном кадре будут выпол- 
няться без задержки до тех пор, пока запись кеша для этого страничного кадра не 
будет перезаписана в ходе последующего выполнения кода. 


Отказ страницы, процедура обработки которого описана на предыдущих шагах, 
называется мягким отказом страницы. Он запускает трансляцию виртуального 
адреса в физический для страницы, которая уже доступна процессору, но отсутст- 
вует в кеше трансляций. 


Жесткий отказ страницы возникает при попытке доступа к странице, которая была 
перенесена во вспомогательное хранилище. Обработка жесткого отказа страницы 
требует нескольких дополнительных шагов, включая резервирование страничного 
кадра для получения запрошенного кадра, запрос страницы из вспомогательного 
хранилища и обновление физического адреса страницы в таблице страниц. По- 
скольку жесткие отказы страниц связаны с дисковыми операциями, отказы этого 
типа оказывают гораздо большее влияние на производительность приложения, чем 
мягкие отказы страниц. 


Процесс трансляции переводит старшие 20 бит виртуального адреса в соответст- 
вующие 20 бит физического адреса. При этом 12 бит в каждой записи таблицы 
страниц остаются доступными для сохранения информации о состоянии и конфи- 
гурации для страничного кадра. Использование этих битов описано в следующем 
разделе. 


Биты состояния страницы 


В табл. 7.1 описан каждый из 12 бит состояния в 32-разрядной записи таблицы 
страниц У/тдоуу$ МТ. 


Таблица 7.1. Биты состояния страницы 


| Бит | Название Описание 


\Уа|а4 (Допусти- Значение | указывает, что эта запись таблицы страниц может 
мость трансляции) | быть использована для трансляции. Если этот бит равен 0, 
остальные биты могут иметь разные значения, как определе- 


но в операционной системе. В описаниях следующих битов 
предполагается, что бит Уа|4 равен 1 


\!тие (Запись) Значение | указывает, что страница доступна для записи, 
значение 0 — страница доступна только для чтения 
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Таблица 7.1 (окончание) 


2 


Оуупег (Владелец) |Значение 1 указывает, что страница находится в режиме 
пользователя, значение 0 — страница находится в режиме 


ядра 


\Мтие ШгоиРИ Значение 1 указывает, что изменения на странице должны 
(Сквозная запись) |быть немедленно сохранены на диск, значение 0 — измене- 
ния страницы будут сохраняться в ОЗУ 


СасВе 41зае4 Значение 1 указывает, что кеширование данной страницы 
(Кеш отключен) отключено, значение 0 — кеширование включено 


Ассез5е4 Значение | указывает, что страница была прочитана или 
(Факт доступа) записана, значение 0 — доступ к странице (любым способом) 
не осуществлялся 


Рщу Значение | указывает, что страница была записана, 
(Факт записи) значение 0 — запись не производилась 


ко всем процессам, значение 0 — эта запись применима 
только к одному процессу 


Процессор использует биты состояния страницы для сохранения информации о со- 
держимом страницы и для управления доступом к каждой странице со стороны 
системных и пользовательских процессов. Бит О\’пег (Владелец) идентифицирует 
страницу как принадлежащую ядру или пользователю. Пользовательские процессы 
не могут читать или записывать какие-либо страницы, принадлежащие ядру. Любая 
попытка записи на страницу, которая помечена как доступная только для чтения 
(бит У/тще (Запись) равен 0), приводит к исключению нарушения доступа. 


Система использует биты состояния страницы для максимально эффективного 
управления памятью. Если бит Ассеззе4 (Факт доступа) имеет нулевое значение, 
страница была зарезервирована, но никогда не использовалась. Когда системе не- 
обходимо освободить физическую память, страницы, к которым никогда не обра- 
щались, являются основными кандидатами на удаление, поскольку при удалении из 
памяти нет необходимости сохранять их содержимое. Аналогично, если бит Ощу 
(Факт записи) имеет нулевое значение, данные страницы не менялись с тех пор, как 
они были перенесены в память. Диспетчер памяти может освобождать страницы с 
нулевым битом Ощу (Факт записи), поскольку известно, что когда страница снова 
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понадобится, ее можно будет опять загрузить из исходного местоположения 
(обычно это файл на диске), чтобы в точности восстановить. 


Страницы с установленным битом Ошу (Факт записи) должны быть сохранены в 
файле подкачки при их удалении из памяти. Когда страница перемещается в файл 
подкачки, соответствующая запись в таблице страниц обновляется с использовани- 
ем другого формата из табл. 7.1, чтобы указать на недопустимость использования 
этой страницы для преобразования (бит Уа114 (Допустимость трансляции) равен 0) 
и сохранить его местоположение в пределах файла подкачки. 


Формат записей таблицы страниц определяется архитектурой процессора, которой 
в данном случае является архитектура семейства Пие!| х86. 


Аппаратные средства процессора обращаются к записям таблицы страниц для 
трансляции виртуального адреса в физический и для обеспечения защиты страниц 
при работе процессора на полной скорости. 


В дополнение к управлению памятью, используемой каждым процессом, система 
должна отслеживать все страничные кадры ОЗУ и ПЗУ на компьютере независимо 
от того, используются они процессом или нет. Система сохраняет эту информацию 
в списках, называемых пулами памяти, которые рассматриваются далее. 


Пулы памяти 


В Ушдо\мз МТ пулы памяти разделены на два типа: с подкачкой и без нее. 


» Пул без подкачки содержит все страничные кадры, которые гарантированно 
всегда остаются резидентными в памяти. Код для процедур обслуживания 
прерываний, драйверов устройств и самого диспетчера памяти всегда должен 
оставаться немедленно доступным для процессора по соображениям поддер- 
жания требуемой производительности системы, а в случае самого диспетчера 
памяти — для того, чтобы система вообще могла функционировать. Невы- 
‘гружаемые виртуальные адреса находятся в системной части виртуального 
адресного пространства процесса. 


» Пул с подкачкой содержит страницы виртуальной памяти, которые при не- 
обходимости могут быть временно выгружены из физической памяти. 


Система отслеживает состояние кадра каждой страницы в физической памяти с по- 
мощью структуры, называемой базой данных номеров страничных кадров (раре 
Кате питбег, РЕМ). РЕМ — это старшие 20 бит физического базового адреса стра- 
ничного кадра. Кадр каждой страницы может находиться в одном из нескольких 
состояний в зависимости от его текущего и предыдущего использования. Вот неко- 
торые из основных состояний страничного кадра. 


» Асйуе (Активный). Страничный кадр является частью рабочего набора сис- 
темного или пользовательского процесса. Рабочий набор — это часть вирту- 
ального адресного пространства процесса, присутствующая в данный момент 
в физической памяти. 
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» ЭУ(апдБу (Ожидающий). Ожидающие страницы — это страницы, которые бы- 
ли удалены из рабочих наборов процесса и не были изменены. 


» Мо4дШеад (Измененный). Измененные страницы были удалены из рабочих на- 
боров процесса и были изменены. Эти страницы должны быть записаны на 
диск, прежде чем их кадры могут быть использованы повторно. 


» Егее (Свободный). Свободные страницы не используются, но еще содержат 
данные о своем последнем участии в рабочем наборе. По соображениям 
безопасности эти страницы не могут быть доступны пользовательскому про- 
цессу до тех пор, пока их содержимое не будет заменено нулями. 


» 1егоед (Обнуленный). Обнуленные страницы являются свободными, а их со- 
держимое было перезаписано нулями. Эти страницы доступны для резерви- 
рования пользовательскими процессами. 


» Вад (Поврежденный). Поврежденные страницы вызвали аппаратные ошибки 
при обращении к ним процессора. Такие страницы отслеживаются в базе 
данных РЕМ и не используются операционной системой. 


По мере запуска, выполнения и завершения работы системных служб и приложе- 
ний страничные кадры переходят из одного состояния в другое под управлением 
системы. В У\У/тдо\$ МТ системная задача выполняется в периоды простоя и пре- 
образует свободные страницы в обнуленные, перезаписывая эти страницы нулями. 


Обсуждение в этом разделе было сосредоточено на реализации виртуальной памяти 
в архитектуре процессоров х86 под управлением ОС \У/тдо\з МТ. Другие процес- 
сорные архитектуры и операционные системы реализуют виртуальную память, ис- 
пользуя аналогичные концепции. 


Компонент процессора, управляющий распределением памяти, преобразованием 
адресов и функциями защиты, называется блоком управления памятью. В сле- 
дующем разделе он рассматривается как обобщенный компонент компьютерной 
системы. 


Блок управления памятью 


В процессорных архитектурах, поддерживающих виртуальную память со странич- 
ной организацией, функции блока управления памятью (тетогу тапаретеп{ 
ип, ММО) реализуются либо внутри самого процессора, либо иногда (особенно в 
достаточно старых решениях) в виде отдельной интегральной схемы. В ММИ вир- 
туальное адресное пространство процессора разделено на единицы распределения 
памяти размером со страницу. 


Страницы могут иметь фиксированный размер, как в случае У/тдо\з МТ, либо 
ММО может поддерживать несколько размеров. Современные процессоры, вклю- 
чая процессоры х86 более поздних поколений, часто поддерживают страницы двух 
размеров: малые и большие. Малые страницы обычно имеют размер несколько ки- 
лобайтов, а большая страница может занимать несколько мегабайтов. Поддержка 
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больших страниц позволяет избежать неэффективности, связанной с выделением 
множества страниц меньшего размера при работе с крупными объектами данных. 


Как обсуждалось ранее, ММО обычно содержит кеш для повышения скорости дос- 
тупа к памяти за счет исключения необходимости просматривать каталог таблиц 
страниц и выполнять поиск в таблице страниц при каждом обращении к памяти. 
Использование кеширования для повышения производительности является темой 
главы 8, однако здесь мы представим кеш для трансляции виртуальных адресов в 
физические, поскольку эта конструкция является основной особенностью боль- 
шинства архитектур ММЦ. 


Компонент кеширования в ММО, который хранит данные ранее выполненных 
трансляций виртуальных адресов в физические, называется буфером ассоциа- 
тивной трансляции (фапз$]айоп 1ооказ14е БиЁЙег, ТЕВ). Для того чтобы избежать 
поиска таблицы страниц в каталоге таблиц страниц, а затем поиска в найденной 
таблице страниц кадра нужной страницы при каждом обращении к памяти, Т.В 
сохраняет данные о трансляции виртуальных адресов в страничные кадры, полу- 
ченные в результате этих поисков, в аппаратной структуре, называемой ассоциа- 
тивной памятью. 


Каждый раз, когда процессору требуется получить доступ к физической памяти, что 
может происходить несколько раз за время выполнения одной инструкции, он снача- 
ла проверяет ассоциативную память ТВ, чтобы определить, нет ли в ТЕВ информа- 
ции о нужной трансляции. Если такая информация в буфере имеется, инструкция не- 
медленно использует ее для доступа к физической памяти. Если ТЁВ не содержит 
данных запрошенной трансляции, возникает отказ страницы, и процессор должен 
заново просмотреть каталог таблиц страниц и таблицу страниц, чтобы определить 
транслированный адрес, предполагая, что нужная страница находится в памяти. 


На рис. 7.5 представлена работа буфера ТГВ. 


Буфер ассоциативной трансляции (ТИВ) 


Одновременные 
сравнения 


Виртуальная страница $10000 


Совпадение 


Рис. 7.5. Работа буфера ассоциативной трансляции 
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При каждом обращении к памяти процессор извлекает из виртуального адреса 
старшие 20 бит, чтобы идентифицировать номер виртуальной страницы. Этот но- 
мер страницы, $10060, в данном примере используется для поиска в ТЕВ соответст- 
вующей записи. Аппаратные средства ТЕВ одновременно сравнивают номер за- 
прошенной виртуальной страницы с номерами всех виртуальных страниц, 
хранящихся в ТЕВ. Если найдено совпадение, номер кадра соответствующей стра- 
ницы немедленно предоставляется для получения доступа к физической памяти. 


ТИВ содержит ограниченное количество записей, обычно 64 или меньше. Процес- 
сор должен управлять тем, какие записи ТЁВ сохраняются, а какие отбрасываются 
по мере обработки запросов адресов для разных ячеек памяти. Когда буфер ТГВ 
заполнен, ММО решает, какую из существующих записей ТГВ перезаписать новой 
информацией. ММО может случайным образом выбрать запись ТВ для замены, 
более сложная реализация ММО может использовать информацию о сроке сущест- 
вования записей для замены записи ТГВ, которая дольше всех не использовалась. 


В дополнение к трансляции виртуального адреса в физический ММУ обычно вы- 
полняют следующие функции. 


» Разделение виртуальной памяти на пространство ядра и пространство 
пользователя. Память ядра зарезервирована для использования операцион- 
ной системой и связанными с ней компонентами, такими как драйверы уст- 
ройств. Пространство пользователя доступно для приложений и для дейст- 
вий, инициируемых пользователями, например для обработки команд, 
набранных в окне командной строки. Код пользовательского уровня не может 
получить прямой доступ к системной памяти. Вместо этого код пользователя 
должен вызывать системные функции для запроса таких услуг, как выделе- 
ние памяти и операции ввода-вывода. 


» Изоляция областей памяти процессов. Каждый процесс имеет собственное 
адресное пространство, являющееся единственной областью памяти, к кото- 
рой ему разрешен доступ. Если между процессами не установлена разрешен- 
ная системой область памяти совместного использования, любому процессу 
запрещено обращаться к памяти, используемой другим процессом. Один 
процесс не может ошибочно или намеренно изменить содержимое памяти, 
которая относится к частной области памяти для другого процесса. 


® Ограничения доступа на уровне страниц. В дополнение к защите систем- 
ных страниц от доступа пользователей и защите частных страниц процессов 
от доступа других процессов процесс может устанавливать защиту на от- 
дельные страницы, которыми он владеет. Страницы могут быть помечены 
как доступные только для ч', ния, что запрещает изменение их содержимого. 
Страницы, помеченные как запрещенные для исполнения, не могут быть 
использованы для предоставления инструкций, выполняемых процессором. 
В некоторых архитектурах страницы могут быть помечены как запрещенные 
для доступа, что устанавливает запрет как на чтение, так и на запись. Стра- 
ницы, содержащие исполняемый код, могут быть помечены как доступные 
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только для чтения, чтобы предотвратить случайное или намеренное измене- 
ние инструкций в памяти. 


» Обнаружение проблем с программным обеспечением. В некоторых языках 
программирования, в частности в языке С, к сожалению, часто наблюдаются 
попытки использовать указатель, содержащий недопустимый адрес (указа- 
тель — это переменная, содержащая адрес другой переменной). Наиболее 
часто в такой ситуации встречается недопустимый адрес 0, поскольку пере- 
менные нередко инициализируются нулем. Эта проблема настолько распро- 
странена, что реакция системы на нее имеет собственное название — исклю- 
чение нулевого указателя. Когда программа на языке С пытается получить 
доступ к ячейке памяти, которая не входит в допустимый диапазон виртуаль- 
ных адресов программы, например к адресу $ее00ее9е, ММО вызывает исклю- 
чение, которое, если его не обработать в программе, обычно приводит к ава- 
рийному завершению программы с выводом сообщения об ошибке в окно 
консоли. В системах без виртуальной памяти обращения к ошибочным ячей- 
кам могут просто приводить к считыванию или записи памяти по указанному 
адресу без какой-либо индикации ошибки, что ведет к некорректной работе 
приложения или всей системы. Такие ошибки в системах без ММО могут 
быть крайне сложными для исправления, если проблема проявляется не сразу. 


Современные процессоры под управлением Глпмх, \\Утд0\%$ и большинства опера- 
ционных систем для мобильных устройств обычно требуют, чтобы их хост- 
системы использовали управление виртуальной памятью и обеспечивали механиз- 
мы защиты страниц, описанные в этой главе. 


Встраиваемые процессоры реального времени, выполняющие критически важные 
для безопасности задачи, такие как управление полетом авиалайнера или работой 
автомобильной подушки безопасности, могут поддерживать или не поддерживать 
полный набор функций ММО. Одним из недостатков, связанных с использованием 
виртуальной памяти в системах жесткого реального времени, является переменная 
временная задержка, возникающая в результате необходимости обработки мягких 
отказов страниц, а также, если реализована подкачка страниц, то и жестких отказов 
страниц. Поскольку во многих ОСРВ время выполнения должно строго контроли- 
роваться, их разработчики часто избегают использования виртуальной памяти. Та- 
кие системы не содержат ММО, но в них часто реализуются многие иные возмож- 
ности ММО, такие как аппаратная защита системной памяти и управление 
доступом к областям оперативной памяти. 


Резюме 


В этой главе были рассмотрены основные категории архитектур современных про- 
цессоров, включая фон-неймановскую, гарвардскую и модифицированную гар- 
вардскую, а также их использование в различных областях вычислений. Были об- 
суждены концепции виртуальной памяти со страничной организацией, включая 
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некоторые детали, относящиеся к реализации такой памяти в \шдо\$ МТ на про- 
цессоре х86. 


Рассмотрена общая структура блока управления памятью (ММО) с упором на ис- 
пользование буфера ассоциативной трансляции (ТГВ) в качестве метода оптимиза- 
ции производительности при трансляции виртуальных адресов в физические. 


В следующей главе мы не ограничимся повышением производительности, обеспе- 
чиваемым ТЕВ, и подробно рассмотрим широко используемые методы ускорения 
процессоров, включая кеширование, конвейерную обработку инструкций и парал- 
лелизм инструкций. 


Упражнения 


1. 16-разрядный встраиваемый процессор имеет отдельные области памяти для 
кода и данных. Код хранится во флеш-памяти, а изменяемые данные — в опе- 
ративной памяти. Некоторые значения данных, такие как константы и началь- 
ные значения для элементов данных оперативной памяти, хранятся в той же об- 
ласти флеш-памяти, что и инструкции программы. ОЗУ и ПЗУ находятся в 
одном адресном пространстве. Какая из архитектур процессоров, рассмотрен- 
ных в данной главе, лучше всего описывает этот процессор? 


2. Процессор, описанный в упражнении [, имеет функции защиты памяти, кото- 
рые не позволяют исполняемому коду изменять память инструкций программы. 
Для доступа к инструкциям и данным этот процессор использует физические 
адреса. Содержит ли он блок управления памятью (ММЦ)? 


3. Порядок доступа к последовательным элементам в большой структуре данных 
может оказать ощутимое влияние на скорость обработки из-за таких факторов, 
как повторное использование записей буфера ТЕВ. Последовательный доступ к 
отдаленным элементам массива (это элементы, находящиеся за пределами 
страничного кадра, где размещены ранее запрошенные элементы) требует час- 
тых мягких отказов страниц по мере загрузки новых записей ТЕВ и удаления 
старых. 


Напишите программу, которая создает большой двумерный массив чисел, на- 
пример на 10 000 строк и 10 000 столбцов. Выполните итеративный обход мас- 
сива в порядке возрастания столбцов, подписывая каждый элемент суммой ин- 
дексов строки и столбца. Доступ по столбцам означает, что индекс столбца 
(второй индекс) увеличивается быстрее всего. Другими словами, индекс столб- 
ца увеличивается во внутреннем цикле. 


Точно измерьте время, которое занимает эта процедура. Обратите внимание, 
что вам может потребоваться принять меры для того, чтобы ваш язык програм- 
мирования не исключил при оптимизации весь этот расчет из-за того, что ре- 
зультаты работы с массивом не используются в дальнейшем. Может быть дос- 
таточно вывести одно из значений массива после завершения отсчета времени 
или же может потребоваться сделать что-то вроде суммирования всех элемен- 
тов массива и вывода этого результата. 
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Повторите процесс, включая измерение времени, точно так же, как было описа- 
но ранее, только измените внутренний цикл на итерацию по индексу строки 
(первый индекс), а внешний цикл — на итерацию по индексу столбца, сделав 
последовательность доступа построчной. 


Во время выполнения вашего кода компьютеры общего назначения выполняют 
множество других задач, поэтому, чтобы получить статистически достоверный 
результат, вам может понадобиться выполнить обе процедуры несколько раз. 
Для начала можно провести эксперимент 10 раз и усреднить время доступа к 
массиву по столбцам и по строкам. 


Можете ли вы определить метод доступа к массиву, постоянно дающий лучший 
результат? Какой порядок является самым быстрым в вашей системе при ис- 
пользовании выбранного вами языка? Следует учитывать, что разница между 
методами с порядком доступа по столбцам и по строкам может быть не слиш- 
ком значительной — она может составлять всего несколько процентов. 


Методы повышения 
производительности 


Фундаментальные аспекты архитектур процессоров и памяти, рассмотренные в 
предыдущих главах, служат основой для полнофункциональной компьютерной 
системы. Однако производительность такой системы по сравнению с большинст- 
вом современных процессоров будет невысокой, если в нее не добавить функции, 
позволяющие увеличить скорость выполнения инструкций. 


При проектировании процессоров и систем обычно используют несколько методов 
повышения производительности для достижения максимальной скорости выполне- 
ния в реальных компьютерных системах. Эти методы не меняют то, что делает 
процессор с точки зрения выполнения программ и обработки данных; они просто 
помогают делать это быстрее. 


После прочтения этой главы вы поймете выгоду от применения многоуровневой 
кеш-памяти в компьютерных архитектурах, а также будете ориентироваться в пре- 
имуществах и проблемах, связанных с конвейерной обработкой инструкций. Вы 
также узнаете, как повысить производительность с помощью одновременной мно- 
гопоточности, и ознакомитесь с назначением и применением модели обработки с 
одним потоком инструкций и множеством потоков данных (зтёе шзгиасНоп, тч]- 
Ире даа, ЗПМО). 


В этой главе будут рассмотрены следующие темы: 
» кеш-память; 
» конвейерная обработка инструкций; 
» одновременная многопоточность; 


е модель обработки 51МО. 


230 Глава 8 


Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 
В@рз://2 Би. сот/Раск Ри БИ то/Модегп-Сотршег-АгепНесиге-апд- 
ОграптаНоп-Зесопд-ЕЗюп. 


Кеш-память 


Кеш-память — это область высокоскоростной памяти (по сравнению со скоростью 
основной памяти), в которой временно хранятся программные инструкции или 
данные для будущего использования. Как правило, эти инструкции или элементы 
данных были недавно извлечены из основной памяти и, вероятно, вскоре снова по- 
надобятся. 


Основное назначение кеш-памяти — увеличить скорость повторного доступа к од- 
ной и той же ячейке памяти, а также к ячейкам памяти, расположенным рядом с 
ней. Для того чтобы обеспечить эффективное ускорение, доступ к кешированным 
элементам должен быть значительно быстрее, чем доступ к исходному источнику 
инструкций или данных, называемому резервным хранилищем. 


Когда используется кеширование, каждая попытка доступа к ячейке памяти начи- 
нается с поиска в кеше. Если запрошенный элемент присутствует в кеше, процес- 
сор немедленно извлекает его и использует. Это называется кеш-попаданием. Ес- 
ли поиск в кеше не увенчался успехом (кеш-промах), инструкция или элемент 
данных извлекается из резервного хранилища. В процессе извлечения запрошенно- 
го элемента его копия добавляется в кеш для предполагаемого использования в бу- 


дущем. 


Кеш-память используется в компьютерных системах для различных целей. Ниже 
приведены некоторые примеры применения кеш-памяти. 


е Буфер ассоциативной трансляции (гап$айоп 1ю0Каз14е Бийег, ТГВ). ТГВ, 
как было показано в главе 7, представляет собой вариант кеш-памяти, которая 
используется в процессорах, поддерживающих виртуальную память со стра- 
ничной организацией. ТЕВ содержит набор записей о трансляции виртуаль- 
ных адресов в физические, которые ускоряют доступ к страничным кадрам в 
физической памяти. По мере выполнения инструкций каждое обращение к 
основной памяти требует трансляции виртуального адреса в физический. Ус- 
пешный поиск в ТГВ приводит к гораздо более быстрому выполнению инст- 
рукций по сравнению с процессом поиска в таблицах страниц после промаха 
ТТВ. Буфер ТЕВ является частью блока управления памятью (ММО) и не 
имеет прямого отношения к вариантам кеш-памяти процессора, обсуждае- 
мым далее в этом разделе. 


е Кеш-память дисковых накопителей. Операции чтения и записи на намаг- 
ниченные пластины дисковых накопителей выполняются на порядки медлен- 
нее, чем доступ к устройствам динамической памяти произвольного дос- 
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тупа (дупатс КАМ, ОКАМ). В дисковых накопителях кеш-память обычно 
используется для хранения выходных данных операций чтения и временного 
хранения данных при подготовке к записи. Контроллеры накопителей часто 
хранят во внутренней кеш-памяти больше данных, чем первоначально за- 
прошенное количество, в расчете на то, что при будущих обращениях будут 
запрашиваться данные, хранящиеся рядом с первоначально запрошенными. 


Если это предположение окажется правильным, как часто бывает, накопитель 
может немедленно отреагировать на второй запрос, передав данные из кеша 
без задержки, связанной с доступом к дискам. 


е Кеш-память веб-браузеров. Веб-браузеры обычно хранят копии недавно по- 
сещенных веб-страниц в памяти в ожидании нажатия пользователем кнопки 
Васк (Назад) для возврата на ранее просмотренную страницу. Когда это про- 
исходит, браузер может извлечь часть или все содержимое этой страницы из 
своего локального кеша и сразу же снова отобразить страницу без необходи- 
мости доступа к удаленному веб-серверу и повторного получения той же ин- 
формации. 


» Кеш-память инструкций и данных процессора. Структуры кеш-памяти 
процессора рассматриваются в следующих разделах. Цель этой кеш- 
памяти — повысить скорость доступа к инструкциям и данным за счет устра- 
нения задержки, возникающей при доступе к модулям РКАМ. 


Кеш-память повышает производительность компьютера, поскольку многие алго- 
ритмы, выполняемые операционными системами и приложениями, демонстрируют 
локальность ссылок. Термин "локальность ссылок" относится к повторному ис- 
пользованию данных, доступ к которым был получен недавно (временная ло- 
кальность), а также к повторному использованию данных, находящихся в физиче- 
ской близости от данных, запрошенных ранее (пространственная локальность). 


Если взять использование структуры ТЁЕВ в качестве примера, то временная ло- 
кальность применяется в нем путем сохранения данных трансляций виртуальных 
адресов в физические в течение некоторого времени после первоначального досту- 
па к определенному страничному кадру. Любые дополнительные обращения к тому 
же страничному кадру в последующих инструкциях обеспечат намного более бы- 
стрый доступ к данным трансляции, пока эти данные в конечном счете не будут 
заменены в кеше данными другой трансляции. 


Пространственную локальность ТГВ использует, ссылаясь на весь страничный кадр 
с помощью одной своей записи. Любые последующие обращения к разным адресам 
на той же странице выиграют по скорости от наличия записи ТВ, полученной в 
результате первой ссылки на эту страницу. 


Как правило, размер областей кеш-памяти невелик по сравнению с размером ре- 
зервного хранилища. Устройства кеш-памяти рассчитаны на максимальную ско- 
рость, что обычно означает, что они являются более сложными и дорогостоящими 
в расчете на бит по сравнению с технологиями хранения данных, используемыми в 
резервном хранилище. Ввиду своего ограниченного размера устройства кеш- 
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памяти обычно быстро заполняются. Если в кеше нет доступного места для хране- 
ния новой записи, необходимо отбросить более раннюю запись. Для выбора записи 
кеша, которая будет перезаписана новой записью, контроллер кеша использует по- 
литику замещения содержимого кеша. 


Цель кеш-памяти процессора — довести долю кеш-попаданий с течением времени 
до максимума, обеспечив тем самым максимально высокую среднюю скорость вы- 
полнения инструкций. Для достижения этой цели логика кеширования должна 
определять, какие инструкции и данные будут помещены в кеш и сохранены для 
будущего использования. 


Логика кеширования процессора не гарантирует, что кешированный элемент дан- 
ных когда-либо будет использоваться снова после того, как он был добавлен в кеш. 


Эта логика основана на том, что благодаря временной и пространственной локаль- 
ности существует достаточно высокая вероятность того, что обращение к кеширо- 
ванным данным последует в ближайшем будущем. На практике в современных 
процессорах кеш-попадания обычно происходят в 95-97% случаев обращений к 
памяти. Поскольку задержка кеш-памяти составляет лишь малую долю от задержки 
ОКАМ, высокая частота кеш-попаданий приводит к существенному повышению 
производительности по сравнению с архитектурой без кеш-памяти. 


В следующих разделах обсуждаются технологии многоуровневого кеширования 
современных процессоров и некоторые политики замещения содержимого кеш- 
памяти, используемые при их реализации. 


Многоуровневое кеширование в процессорах 


За годы, прошедшие с момента появления персональных компьютеров, процессоры 
продемонстрировали значительное увеличение скорости обработки инструкций. 
Внутренние часы современных процессоров ше! и АМР почти в 1000 раз быстрее, 
чем у процессора 8088, использовавшегося в первом 1ВМ РС. Для сравнения, ско- 
рость технологии памяти РКАМ со временем увеличивалась гораздо медленнее. 
Исходя из этих тенденций, можно сказать, что если бы современный процессор 
имел прямой доступ к ОВАМ для всех своих инструкций и данных, он тратил бы 
существенную долю своего времени на ожидание ответа ОКАМ на каждый запрос. 


Для того чтобы дать для этой темы некоторые приблизительные цифры, рассмот- 
рим современный процессор, способный обрабатывать 32-битное значение данных 
из регистра процессора за 1 нс. Доступ к такому значению из ОКАМ может занять 
100 нс. Несколько упростим ситуацию: если для каждой инструкции требуется од- 
но обращение к ячейке памяти, а время выполнения каждой инструкции намного 
меньше времени доступа к памяти, можно ожидать, что цикл обработки, в котором 
выполняется доступ к требуемым данным из регистров процессора, будет работать 
в 100 раз быстрее, чем тот же алгоритм, обращающийся к основной памяти при вы- 
полнении каждой инструкции. 


Теперь предположим, что в систему добавлена кеш-память со временем доступа 
4 нс. Благодаря преимуществам кеш-памяти алгоритм, который обращается к 
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ОБВАМ при выполнении каждой инструкции, будет испытывать снижение произво- 
дительности, затрачивая на первое обращение к определенному адресу 100 нс, но 
последующие обращения к тем же и соседним адресам будут происходить со ско- 
ростью доступа к кеш-памяти — 4 нс. Доступ к кешу в четыре раза медленнее, чем 
доступ к регистрам, однако он все же в 25 раз быстрее доступа к ОКАМ. Этот при- 
мер показывает степень ускорения выполнения, достижимую за счет эффективного 
применения кеш-памяти в современных процессорах. 


Высокопроизводительные процессоры обычно используют несколько уровней ке- 
ширования с целью достижения максимальной скорости выполнения инструкций. 
Аппаратные средства кеша процессора ограничены по размеру и производительно- 
сти экономикой полупроводниковых технологий. Выбор оптимального сочетания 
типов и размеров кеш-памяти процессора при условии получения приемлемой для 
конечных пользователей цены является ключевой целью разработчиков процессоров. 


В качестве основной памяти и для внутреннего хранения данных процессора обыч- 
но используются схемы оперативной памяти двух типов — динамическая (ОКАМ) 
и статическая (КАМ) оперативная память. Схемы ОКАМ имеют невысокую цену, 
но предлагают сравнительно медленный доступ, в основном из-за затрат времени 
на зарядку и разрядку конденсаторов битовых ячеек во время операций чтения и 
записи. 


ЗКАМ намного быстрее ОКАМ, но и намного дороже ее, чем обусловлено исполь- 
зование небольших объемов статической памяти в системах, где производитель- 
ность имеет решающее значение. Конструкции схем ОКАМ оптимизированы по 
плотности, результатом чего является хранение максимально возможного количе- 
ства битов на одной интегральной схеме ОКАМ. Конструкции схем ЗКАМ оптими- 
зированы по скорости, чтобы свести к минимуму время чтения или записи ячейки 
памяти. Кеш-память процессора обычно реализуется с использованием статической 
оперативной памяти. 


Статическая оперативная память 


Статическая оперативная память (айс КАМ, ЗКАМ) предлагает значительно 
более быстрый доступ к данным по сравнению с ОКАМ, хотя и за счет значительно 
более сложной схемы. Битовые ячейки ЗКАМ занимают гораздо больше места на 
кристалле интегральной схемы, чем ячейки ОКАМ, способные хранить эквива- 
лентный объем данных. Как вы помните из главы 4, одна битовая ячейка ОВАМ 
состоит всего из одного полевого МОП-транзистора и одного конденсатора. 


Стандартная схема для одного бита ЗКАМ содержит шесть полевых МОП-тран- 
зисторов. Четыре из этих транзисторов используются для формирования двух 
элементов НЕ. Эти вентили основаны на КМОП-схеме, показанной на рис. 4.3 в 
разд "Знакомство с полевыми МОП-транзисторами" главы 4. Эти вентили обо- 
значены как С1 и С на рис. 8.1. 


Выход каждого элемента НЕ соединен со входом другого, образуя триггер. Боль- 
шую часть времени на шине слов сохраняется низкий уровень, что поддерживает 
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транзисторные переключатели Г, и Т› в выключенном состоянии, изолируя эту па- 
ру вентилей. Пока на шине слов действует низкий уровень (и подача питания про- 
должается), вентили будут находиться в одном из двух состояний: 


» сохраненный бит равен 0: на входе С — низкий уровень, а на его выходе — 
высокий; 


» сохраненный бит равен 1: на входе С, — высокий уровень, а на его выхо- 
де — низкий. 


Шина слов 


Шина битов 
Шина битов 


Рис. 8.1. Схема ячейки $КАМ 


Входные транзисторы (Т, и Т›) функционируют как переключатели, которые со- 
единяют шину битов с ячейкой для чтения и записи. Как и в случае с ОКАМ, пере- 
вод шины слов на высокий уровень обеспечивает доступ к битовой ячейке за счет 
уменьшения сопротивления на каждом входном транзисторе до очень малого зна- 
чения. Для того чтобы считать содержимое ячейки, схема считывания измеряет на- 
пряжение между парой шин битов, обозначенных Шина битов и Шина битов (где 
линия сверху означает инверсию — операцию НЕ). Сигналы этих двух шин всегда 
имеют противоположные значения, образуя дифференциальную пару. Измерение 
знака разности напряжений между двумя сигналами позволяет определить содер- 
жимое ячейки: 0 или |. 


При записи в битовую ячейку шина слов переводится на высокий уровень, а на ши- 
ны битов подаются сигналы с противоположными уровнями напряжения, пред- 
ставляющие желаемое значение (0 или 1) для записи. Транзисторы, записывающие 
данные в шины битов, должны обладать существенно большей мощностью, чем 
транзисторы вентилей НЕ битовой ячейки. Благодаря этому желаемое значение 
можно записать в ячейку, даже если при этом необходимо подавить состояние 
триггера, чтобы переключить его в записываемое состояние. 


Банк памяти ЗКАМ представляет собой прямоугольную сетку строк и столбцов, 
как ив ОКАМ. Шина слов обеспечивает доступ ко всем битовым ячейкам ЗКАМ в 
одной строке. Шины битов соединяются со всеми столбцами сетки битовых ячеек. 


В отличие от ОВАМ, в ЗВАМ не требуется периодическое обновление для сохра- 
нения хранящихся в ячейках данных. Именно по этой причине этот вариант памяти 
называют статической оперативной памятью. 
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В следующем разделе мы увидим, как с помощью ЗКАМ создается первый уровень 
кеш-памяти процессора. 


Кеш первого уровня 


В кеш-памяти с многоуровневой архитектурой уровни нумеруются, начиная с 1. 
Кеш первого уровня (который также называют кеш Г.1) — это первая область кеш- 
памяти, к которой процессор обращается при запросе информации или элемента 
данных из памяти. Так как это первое обращение к кеш-памяти, кеш Г] обычно 
создается с использованием самой быстрой доступной технологии ЗВАМ и физи- 
чески расположен максимально близко к логической схеме процессора. 


Акцент на скорости делает кеш Г.1 дорогостоящим и энергозатратным. Это означа- 
ет, что он должен быть довольно небольшим по сравнению с основной памятью, 
особенно в решениях, где затраты являются важным фактором. Даже при скромных 
размерах быстрый кеш первого уровня может обеспечить существенное повышение 
производительности по сравнению с аналогичным процессором, в котором не ис- 
пользуется кеширование. 


Процессор (или блок управления памятью, ММО, если он присутствует) перемеща- 
ет данные между ОКАМ и кешем в виде блоков данных фиксированного размера, 
называемых строками кеша. В компьютерах, оснащенных модулями ОРВ ОКАМ, 
размер строки кеша обычно равен 64 байтам. Такой же размер строки кеша обычно 
используется на всех уровнях кеш-памяти. 


В современных процессорах кеш [1 часто разделяют на две секции одинакового 
размера: одну для инструкций и одну для данных. Такую конфигурацию называют 
разделенной кеш-памятью. В ней кеш инструкций первого уровня называют 
1-кеш Г1, а кеш данных первого уровня — О-кеш 1/1. Процессор использует от- 
дельные шины для доступа к каждому из этих кешей, тем самым реализуя важный 
аспект гарвардской архитектуры. Такая организация ускоряет выполнение инст- 
рукций за счет параллельного доступа к инструкциям и данным с учетом того, что 
кеш Г.1 используется для обоих видов доступа. 


В современных процессорах применяют множество стратегий для организации 
кеш-памяти и управления ее работой. Простейшей конфигурацией кеш-памяти яв- 
ляется кеш с прямым отображением, представленный в следующем разделе. 


Кеш с прямым отображением 


Кеш с прямым отображением — это блок памяти, организованный в виде одно- 
мерного массива наборов кеша, где каждый адрес в основной памяти сопоставлен с 
одним набором в кеше. Каждый набор кеша состоит из следующих элементов: 


» строка кеша, содержащая блок данных, считанных из основной памяти; 


е значение тега, указывающее местоположение в основной памяти, соответст- 
вующее кешированным данным, 


» бит допустимости, указывающий, содержит ли этот набор кеша данные. 
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В этом примере представлен кеш инструкций, доступный только для чтения. Кеши 
данных для чтения и записи мы рассмотрим в следующем разделе. 


Бывают случаи, когда кеш не содержит данных, например сразу после включения 
процессора. Бит допустимости каждого набора кеша изначально имеет нулевое 
значение, что указывает на отсутствие данных в наборе. Когда бит допустимости 
равен 0, использование этого набора для поиска запрещено. При загрузке данных в 
набор кеша, аппаратные средства устанавливают бит допустимости. 


В качестве примера мы будем использовать небольшой [-кеш 1/1 размером 
512 байт. Поскольку это кеш инструкций, доступный только для чтения, для него 
не требуется поддержка возможности записи в память. Размер строки кеша состав- 
ляет 64 байта. Деление 512 байт на 64 байта для каждого набора дает 8 наборов кеша. 


64 байта в каждом наборе — это 2° байт, т.е. 6 наименее значимых битов адреса 
определяют местоположение в строке кеша. Для выбора одного из восьми наборов 
кеша требуются три дополнительных бита адреса. 


Исходя из этой информации, на рис. 8.2 показано разделение 32-разрядного адреса 
физической памяти на компоненты: тег, номер набора и байтовое смещение строки 


кеша. 
Тег Байтовое смещение 


23 бита 3 бита 6 бит 
Рис. 8.2. Компоненты 32-разрядного адреса физической памяти 


Каждый раз, когда процессор считывает инструкцию из ОКАМ (что необходимо 
всякий раз, когда инструкция отсутствует в кеше), ММИ считывает 64-байтовый 
блок, содержащий адресованную ячейку, и сохраняет его в наборе 1-кеша Г.1, вы- 
бранном тремя битами компонента "Набор", показанного на рис. 8.2. Старшие 
23 бита адреса хранятся в поле "Тег" набора кеша, а бит допустимости установлен. 


По мере того, как процессор извлекает каждую последующую инструкцию, устрой- 
ство управления использует три бита компонента "Набор" в адресе инструкции, 
чтобы выбрать набор кеша для сравнения. Аппаратные средства сравнивают стар- 
шие 23 бита адреса выполняемой инструкции со значением тега, хранящимся в вы- 
бранном наборе кеша. Если эти значения совпадают, то произошло кеш-попадание, 
и процессор считывает инструкцию из строки кеша. Если происходит кеш-промах, 
ММО считывает строку из ОКАМ в соответствующий набор кеша (перезаписывая 
любые существующие данные для этого набора) и передает инструкцию устройст- 
ву управления для выполнения. 


На рис. 8.3 представлены организация всего 512-байтового кеша и его связь с тремя 
полями в 32-разрядном адресе инструкции. 


Для того чтобы продемонстрировать, почему кеш с прямым отображением может 
обеспечить высокую частоту попаданий, предположим, что мы запускаем програм- 
му, содержащую цикл, начинающийся с адреса физической памяти 80001 (здесь для 
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простоты мы игнорируем старшие 16 бит 32-разрядного адреса) и содержащий 
256 байт кода. В этом цикле инструкции выполняются последовательно от начала 
до конца 256-байтового диапазона, после чего осуществляется возврат к началу 
цикла для следующей итерации. 


32-разрядный физический адрес 


Набор |Байтовое смещение 


23 бита 3 бита 6 бит 


1 бит 23 бита 64 байта 
Рис. 8.3. Связь 32-разрядного физического адреса с кеш-памятью 


Адрес 80001 содержит 0006 в поле "Набор", поэтому этот адрес сопоставляется с 
первым набором кеша, как показано на рис. 8.3. При первом проходе через цикл 
ММИ извлекает из ОКАМ 64-байтовую строку кеша и сохраняет ее в первом набо- 
ре кеша (со значением поля "Набор", равным 0005). По мере выполнения остальных 
инструкций, хранящихся в том же 64-байтовом блоке, каждая из них будет извле- 
каться непосредственно из кеша. 


При переходе процесса выполнения ко второму 64-байтовому блоку потребуется 
еще одно обращение к ОВАМ для считывания данных. К моменту достижения кон- 
ца цикла наборы с 0006 по 011Ъ оказываются заполненными 256 байтами кода для 
данного цикла. Для оставшихся проходов через этот цикл, с учетом предположе- 
ния, что поток выполняется без прерываний, процессор достигнет 100% кеш- 
попаданий и максимальной скорости выполнения инструкций. 


С другой стороны, если инструкции в цикле потребляют значительно больше памя- 
ти, то выгода от кеширования уменьшится. Предположим, что инструкции цикла 
занимают 1024 байта, т. е. вдвое больше размера кеша. В цикле, с его начала и до 
конца, выполняется одна и та же последовательность. Когда адреса инструкций 
достигают середины цикла, кеш оказывается заполненным первыми 512 байтами 
инструкций. В начале следующей строки кеша после средней точки адрес будет 
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равен 80006 плюс 512, что равно 82001. Группа битов "Набор" в адресе 82001 — та 
же, что и в адресе 80001, что приводит к перезаписи строки кеша для адреса 80006 
строкой кеша для адреса 82001. Каждая последующая строка кеша будет перезапи- 
сываться по мере выполнения кода второй половины цикла. 


Несмотря на то что все области кешированной памяти перезаписываются при каж- 
дом прохождении цикла, структура кеш-памяти по-прежнему обеспечивает значи- 
тельную выгоду, т. к. после считывания из ОКАМ каждая 64-байтовая строка оста- 
ется в кеше и доступна для использования по мере выполнения инструкций. 
Недостатком в этом примере является повышенная частота промахов кеша. Это 
влечет за собой существенное снижение производительности, поскольку, как мы 
видели, доступ к инструкции в ОКАМ может быть в 25 (или более) раз медленнее, 
чем доступ к той же инструкции в 1-кеше [1]. 


ТЕГИ ВИРТУАЛЬНЫХ И ФИЗИЧЕСКИХ АДРЕСОВ 
ПРИ КЕШИРОВАНИИ 


Пример в этом разделе предполагает, что кеш-память использует адреса 
физической памяти для пометки записей кеша. Это означает, что в сис- 
темах с поддержкой виртуальной памяти со страничной организацией 
адреса, используемые при поиске в кеше, являются результатом транс- 
ляции виртуальных адресов в физические. Разработчик процессора 
должен выбрать, какие адреса следует использовать для целей кеширо- 
вания — виртуальные или физические. 


В кеш-памяти современных процессоров на одном или нескольких 

и уровнях кеширования нередко используются теги виртуальных адресов, 

(7 а на остальных уровнях — теги физических адресов. Одним из пре- 

имуществ использования тегов виртуальных адресов является скорость, 

поскольку при обращении к кешу не требуется трансляция виртуально- 

го адреса в физический. Как мы видели, при трансляции виртуального 

адреса в физический выполняется поиск в буфере ТИВ и, возможно, 

поиск по таблице страниц в случае промаха ТЁВ. Однако использова- 

ние тегов виртуальных адресов создает другие проблемы, такие как 

множественность ссылок, которая возникает, когда один и тот же вир-. 
туальный адрес ссылается на разные физические адреса. 


Как и во многих других аспектах оптимизации производительности 
процессора, это компромисс, который следует учитывать при проекти- 
ровании системы кеширования. 


Этот пример был упрощен за счет предположения, что выполнение инструкций 
происходит линейно с начала и до конца цикла без каких-либо обходных путей. 
В реальном коде часто происходят вызовы функций в различных областях памяти 
приложения и обращения к системным библиотекам. 
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В дополнение к этим факторам информация в кеше часто перезаписывается при 
выполнении других системных действий, таких как обработка прерываний и пере- 
ключение контекста потока, что приводит к более высокой частоте промахов кеша. 
Это влияет на производительность приложения, поскольку код основной ветви 
должен выполнять дополнительные обращения к ОКАМ для перезагрузки кеша 
после каждого отклонения, которое приводило к изменениям записей в кеше. 


Одним из способов уменьшить последствия отклонений от прямолинейного вы- 
полнения кода является настройка нескольких кешей, работающих параллельно. 
Такую конфигурацию, которая обсуждается в следующем разделе, называют на- 
борно-ассоциативным кешем. 


Наборно-ассоциативный кеш 


В двухканальном наборно-ассоциативном кеше память делится на два кеша одина- 
кового размера. Каждый из них содержит половину общего количества записей ке- 
ша с прямым отображением того же общего размера. При каждом доступе к памяти 
аппаратные средства обращаются к обоим кешам параллельно, и попадание может 
произойти в любом из них. Следующая схема иллюстрирует одновременное срав- 
нение тега 32-разрядного адреса с тегами, содержащимися в двух [-кешах [.1. 


32-разрядный физический адрес 


РЯ 
смещение 
24 бита 2 бита 6 бит 


|. Набор 006 


16бит 24бита 64 байта 1бит 24бита 64 байта 
Рис. 8.4. Работа наборно-ассоциативного кеша 


Конфигурация кеша, показанная здесь, имеет тот же размер строки кеша (64 байта), 
что и кеш на рис. 8.3, но вдвое меньше наборов на кеш. Общий размер кеш-памяти 
такой же, как и в предыдущем примере: 64 байта на строку, умноженные на 4 стро- 
ки, умноженные на 2 кеша, равны 512 байтам. Поскольку теперь существует четыре 
набора, поле "Набор" в физическом адресе уменьшается до 2 бит, а поле "Тег" уве- 
личивается до 24 бит. Каждый набор состоит из двух строк кеша, по одной в каж- 
дом из двух кешей. 


При кеш-промахе логика управления памятью должна выбрать, какую из двух таб- 
лиц кеша использовать в качестве места назначения для данных, загружаемых из 
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ОКАМ. Общепринятый метод заключается в том, чтобы отслеживать, к какому из 
соответствующих наборов в двух таблицах дольше не было обращений, и переза- 
писать эту запись. Эта политика замещения, называемая Г.В О ([еа5{ гесеп Ну изед — 
замена наиболее давно использовавшегося элемента), требует аппаратной под- 
держки для отслеживания того, какая строка кеша не была востребована дольше 
всего. Политика Г.В О основана на эвристике временной локальности, которая гла- 
сит, что данные, к которым не обращались в течение длительного времени, с мень- 
шей вероятностью будут затребованы снова в ближайшее время. 


Другой способ выбора между двумя таблицами — просто чередовать их при после- 
довательных вставках в кеш. 


Аппаратные средства для реализации этой политики замены проще, чем для поли- 
тики ГКО, но такой подход может повлиять на производительность из-за того, что 
произвольный выбор строки может быть неверным. Выбор политики замещения 
содержимого кеша представляет собой еще одну область компромисса между по- 
вышенной сложностью аппаратных средств и постепенным повышением произво- 
дительности. 


В двухканальном наборно-ассоциативном кеше две строки кеша из разных физиче- 
ских местоположений с совпадающими полями "Набор" могут присутствовать в 
кеше одновременно, при условии, что обе строки кеша допустимы. В то же время, 
по сравнению с кешем с прямым отображением того же общего размера, каждый из 
двухканальных наборно-ассоциативных кешей имеет вдвое меньший размер. Это 
еще один компромисс проектирования: количество уникальных значений поля 
"Набор", которые могут храниться в двухканальном наборно-ассоциативном кеше, 
меньше по сравнению с прямым отображением, но при этом возможно одновре- 
менное кеширование нескольких строк кеша с одинаковыми полями "Набор". 


Конфигурация кеша, обеспечивающая наилучшую общую производительность сис- 
темы, будет зависеть от особенностей доступа к памяти, связанных с типами опе- 
раций обработки, выполняемых в системе. 


Наборно-ассоциативный кеш может содержать более двух кешей, рассмотренных в 
этом примере. Современные процессоры часто имеют 4, 8 или 16 параллельных 
кешей, которые называют 4-канальными, 8-канальными и 16-канальными наборно- 
ассоциативными кешами. Эти кеши называются наборно-ассоциативными, т. к. 
поле "Тег" адреса одновременно относится ко всем строкам кеша в наборе. Кеш с 
прямым отображением реализует одноканальный наборно-ассоциативный кеш. 


Преимущество многоканальных наборно-ассоциативных кешей по сравнению с 
кешами с прямым отображением заключается в том, что они, как правило, имеют 
более высокую частоту кеш-попаданий, что в большинстве практических случаев 
ведет к повышению производительности системы по сравнению с кешами с пря- 
мым отображением. Если многоканальные наборно-ассоциативные кеши обеспечи- 
вают лучшую производительность, чем одноканальные кеши с прямым отображе- 
нием, то почему бы тогда не повысить уровень ассоциативности? Доведенная до 
предела, эта прогрессия заканчивается полностью ассоциативным кешированием. 
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Полностью ассоциативный кеш 


Предполагая, что количество строк в кеше равно степени двойки, повторяющееся 
разделение общей кеш-памяти на большее количество меньших параллельных ке- 
шей, пока каждый кеш не будет содержать только одну строку, приводит к получе- 
нию полностью ассоциативного кеша. 


В нашем примере 512-байтового кеша с 64 байтами на строку кеша этот процесс 
приведет к созданию восьми параллельных кешей, каждый из которых содержит 
только один набор. 


В этой архитектуре каждое обращение к памяти приводит к параллельному срав- 
нению со значениями тегов, хранящимися во всех строках кеша. Полностью ассо- 
циативный кеш с использованием эффективной политики замены, такой как Г.ВО, 
может обеспечить очень высокую частоту кеш-попаданий, хотя и при значитель- 
ных затратах на сложность схемы и соответствующее потребление площади кри- 
сталла. 


В решениях, чувствительных к энергопотреблению, таких как мобильные устрой- 
ства с питанием от аккумулятора, повышение сложности схемы полностью ассо- 
циативного кеша приводит к увеличению разряда аккумулятора. В настольных 
компьютерах и облачных серверах энергопотребление процессора должно быть 
сведено к минимуму, чтобы избежать необходимости в чрезвычайных мерах для 
охлаждения и свести к минимуму счета за электроэнергию для поставщиков облач- 
ных услуг, эксплуатирующих тысячи серверов. Ввиду таких затрат полностью ас- 
социативный кеш редко используется в качестве кеша инструкций и данных в со- 
временных процессорах. 


Концепция, лежащая в основе полностью ассоциативного кеша, может показаться 
знакомой, поскольку это та же концепция, которая применяется в буфере ТГВ, опи- 
санном в главе 7. ТЕВ обычно представляет собой полностью ассоциативный кеш, 
содержащий результаты трансляции виртуальных адресов в физические. Использо- 
вание полностью ассоциативного кеширования в ТГ.В имеет свои недостатки, опи- 
санные в предыдущем абзаце: сложность схемы, потребность в дополнительной 
площади кристалла и повышенное энергопотребление, — однако преимущество в 
виде повышения производительности, которое обеспечивает ТГВ, настолько суще- 
ственно, что полная ассоциативность применяется практически во всех высокопро- 
изводительных процессорах, где реализована виртуальная память со страничной 
организацией. 


Наше обсуждение до этого момента было сосредоточено на кешировании инструк- 
ций, которое обычно является процессом с доступом только для чтения. Функцио- 
нальные требования к кешу данных во многом аналогичны требованиям к кешу 
инструкций с одним важным дополнением: помимо чтения из памяти данных про- 
цессор должен быть свободен для записи в память данных. Это тема следующего 
раздела. 
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Политики записи в кеш процессора 


В процессорах с разделенной кеш-памятью О-кеш [Г аналогичен по структуре 
1-кешу Г.1 за исключением того, что схема должна позволять процессору не только 
считывать данные из памяти, но и записывать их в память. Каждый раз, когда про- 
цессор записывает значение данных в память, он должен обновить строку Р-кеша 
Е.1, содержащую этот элемент данных, и в какой-то момент времени он также дол- 
жен обновить ячейку ОКАМ в физической памяти, содержащую эту строку кеша. 
Запись в память ОКАМ, как и чтение из нее, является медленным процессом по 
сравнению со скоростью записи в О-кеш Г.1. 


Ниже перечислены наиболее распространенные политики записи в кеш в совре- 
менных процессорах. 


е Сквозная запись (утгИе-@гоирг|). Эта политика предусматривает немедлен- 
ное обновление ОВАМ каждый раз, когда процессор записывает данные в 
память. 


» Отложенная запись (угие-БасК). При использовании этой политики изме- 
ненные данные удерживаются в кеше до тех пор, пока соответствующая 
строка не будет вытеснена из кеша. Для каждой строки кеша с отложенной 
записью должен быть предусмотрен дополнительный бит состояния, указы- 
вающий, были ли изменены данные с момента их считывания из ОКАМ. Этот 
бит называется битом факта записи. Установленное состояние этого бита 
указывает, что данные в этой строке были изменены, и система должна запи- 
сать их в ОКАМ, прежде чем соответствующая строка кеша может быть ос- 
вобождена для повторного использования. 


Политика отложенной записи обычно приводит к повышению производительности 
системы, поскольку дает процессору возможность выполнять несколько операций 
записи в одну и ту же строку кеша без необходимости обращаться к основной па- 
мяти при каждой записи. В системах с несколькими ядрами или несколькими про- 
цессорами использование кеширования с отложенной записью создает сложности, 
поскольку Р-кеш Г,1, принадлежащий ядру, которое выполняет запись в ячейку па- 
мяти, будет содержать данные, отличающиеся от содержимого соответствующей 
ячейки ОКАМ и от любых копий в кешах других процессоров или ядер. Такое не- 
соответствие содержимого памяти будет сохраняться до тех пор, пока эта строка 
кеша не будет записана в ОКАМ и обновлена в любом из кешей процессора, где 
она находится. 


Как правило, недопустимо, чтобы разные ядра процессора извлекали различные 
значения при обработке одной и той же ячейки памяти, поэтому необходимо пре- 
дусмотреть решение, гарантирующее, что все процессоры всегда видят одни и те 
же данные в каждой ячейке памяти. Задача поддержания идентичных представле- 
ний содержимого памяти на нескольких процессорах называется задачей согласо- 
вания кеша. 


В многоядерном процессоре можно было бы решить эту проблему путем организа- 
ции общего доступа всех ядер к одному и тому же О-кешу ГЛ, но современные 
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многоядерные процессоры обычно реализуют отдельный О-кеш [1 для каждого 
ядра, чтобы довести скорость доступа до максимума. В многопроцессорных систе- 
мах с общей основной памятью, где процессоры находятся на отдельных инте- 
гральных схемах, и в многоядерных процессорах, которые не используют общий 
кеш [.1, эта задача отличается большей сложностью. 


В некоторых многопроцессорных архитектурах для поддержания согласованности 
кеша применяется отслеживание. Наблюдая за памятью, процессор отслеживает 
операции записи в память, выполняемые другими процессорами. Когда происходит 
запись в ячейку памяти, присутствующую в кеше отслеживающего процессора, от- 
слеживающее устройство выполняет одно из двух действий: оно может сделать не- 
действительной свою строку кеша, установив бит допустимости в состояние +а1зе, 
или занести в эту строку данные, записанные другим процессором. Если строка 
кеша признана недопустимой, следующее обращение к диапазону адресов этой 
строки вызовет доступ к ОКАМ для получения данных, измененных другим про- 
цессором. 


Отслеживание может быть эффективным в системах с ограниченным числом про- 
цессоров, но его сложно масштабировать для систем, содержащих десятки или сот- 
ни процессоров. Это связано с тем, что каждый процессор должен постоянно от- 
слеживать операции записи всех других процессоров. В системах с большим 
количеством процессоров должны быть реализованы другие, более сложные прото- 
колы согласования кеша. 


Кеши процессора второго и третьего уровней 


До настоящего момента наше обсуждение было сосредоточено на кешах инструк- 
ций и данных первого уровня — 1.1. Эти кеши спроектированы так, чтобы быть 
максимально быстрыми, но акцент на скорости ограничивает их размер из-за слож- 
ности схемы кеша и требований к питанию. 


Из-за большой разницы в задержке кеша Г] и ОКАМ разумно задаться вопросом: 
может ли промежуточный уровень кеширования между Г.] и ОКАМ повысить про- 
изводительность по сравнению с процессором, содержащим только кеш Г.1? От- 
вет — да, добавление кеша Г.2 обеспечивает существенное повышение производи- 
тельности. 


На кристаллах современных высокопроизводительных процессоров обычно содер- 
жится банк кеша [,2 значительного объема. В отличие от кеша 1,1, кеш 1.2 обычно 
объединяет инструкции и данные в одной области памяти, представляя архитектуру 
фон Неймана, а не характерное для гарвардской архитектуры разделение в структу- 
ре кеша Г.1. 


Кеш 1.2 обычно работает медленнее, чем кеш Г.1, но все же намного быстрее, чем 
прямой доступ к ОКАМ. Кеш [2 использует битовые ячейки ЗКАМ с той же базо- 
вой схемой, что показана на рис. 8.1, однако в схемном решении Г.2 уделяется осо- 
бое внимание уменьшению занимаемой на кристалле площади в расчете на бит и 
снижению энергопотребления по сравнению со схемным решением 1.11. Эти моди- 
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фикации позволяют сделать кеш Г.2 намного больше по объему, чем кеш Г.1, но они 
также делают его значительно медленнее. 


Типичный кеш Г.2 может быть в четыре или восемь раз больше, чем [-кеш и О-кеш 
Г.1 вместе взятые, при этом время доступа у него будет в 2-3 раза больше, чем у Г. 
В зависимости от конструкции процессора кеш Г.2 может включать или не вклю- 
чать в себя кеш Г.1. Инклюзивный кеш [,2, помимо других строк, всегда содержит 
строки кеша, имеющиеся в кеше [.]. 


Как мы уже видели, каждый раз, когда процессор обращается к памяти, он сначала 
обращается к кешу [/1. Если происходит промах кеша [.1, следующим пунктом для 
проверки является кеш Г.2. Поскольку Г.2 больше, чем [.1, существует значительная 
вероятность того, что данные будут найдены именно там. Если искомая строка ке- 
ша отсутствует в Г.2, требуется доступ к ОКАМ. Процессоры обычно выполняют 
некоторые из этих шагов параллельно, чтобы гарантировать, что промах кеша не 
приведет к длительному последовательному поиску запрошенных данных. 


Каждый промах кеша Г.1 и Г.2 приводит к выполнению операции чтения ОКАМ, 
которая заполняет соответствующие строки кеша в [.1 и [2 при условии, что Г.2 
является инклюзивным. За каждой выполняемой процессором операцией записи в 
память данных рано или поздно должно последовать обновление как [.1, так и Г.2. 
О-кеш Г.1 реализует политику записи в кеш (обычно это политика сквозной или 
отложенной записи), чтобы определить, когда должно быть выполнено обновление 
кеша [.2. В кеше Г.2, аналогичным образом, реализована собственная политика за- 
писи, помогающая определить, когда следует записывать измененные строки кеша 
в ОВАМ. 


Если использование двух уровней кеша помогает повысить производительность, 
стоит ли ограничиваться лишь ими? В действительности в большинстве современ- 
ных высокопроизводительных процессоров реализованы три (или даже более!) 
уровня кеша на кристалле. Как и при переходе от Г.1 к 1.2, переход от Г.2 к [3 вле- 
чет за собой увеличение объема памяти и уменьшение скорости доступа. Как и [.2, 
кеш Г.3 обычно объединяет инструкции и данные в одной области памяти. В про- 
цессорах потребительского уровня кеш [.3 обычно представляет собой ЗКАМ объ- 
емом в несколько мегабайт с временем доступа в 3—4 раза медленнее, чем кеш Г.2. 


ВЗГЛЯД ПРОГРАММИСТА НА КЕШ-ПАМЯТЬ 


Разработчикам программного обеспечения не нужно предпринимать 
какие-либо шаги, чтобы воспользоваться преимуществами кеш-памяти, 
однако понимание среды, в которой работает их программное обеспе- 

< чение, может помочь повысить производительность кода, выполняемо- 
го процессорами с несколькими уровнями кеш-памяти. При наличии 
достаточной гибкости определение размеров структур данных и струк- 
турирование внутренних циклов кода для работы в пределах предпола- 
гаемых размеров кешей [.1, Г.2 и [.3 может привести к значительному 
увеличению скорости выполнения. 
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На производительность любого фрагмента кода влияет множество фак- 
торов, связанных с архитектурой процессора и поведением системного 
программного обеспечения, поэтому лучший способ определить опти- 
мальный алгоритм среди нескольких жизнеспособных альтернатив — 
это тщательное сравнение производительности каждого из них. 


Многоуровневая иерархия кеш-памяти в современных процессорах приводит к зна- 
чительному повышению производительности по сравнению с аналогичной систе- 
мой без кеш-памяти. Кеширование позволяет самым быстрым процессорам боль- 
шую часть времени работать с минимальной задержкой доступа к ОКАМ. 
Несмотря на то что кеш-память значительно усложняет конструкцию процессора и 
потребляет много ценного места на кристалле и энергии, производители процессо- 
ров решили, что использование многоуровневой архитектуры кеш-памяти вполне 
оправдывает эти затраты. 


Кеш-память ускоряет выполнение инструкций за счет уменьшения задержки досту- 
па к памяти при извлечении инструкций и данных, на которые ссылаются эти инст- 


рукции. 


Следующая область повышения производительности, которую мы рассмотрим, — 
это возможности оптимизации в процессоре, помогающие увеличить скорость вы- 
полнения инструкций. Основным методом, который применяется в современных 
процессорах для достижения прироста производительности таким способом, явля- 
ется конвейеризация. 


Конвейерная обработка инструкций 


Прежде чем представить конвейерную обработку, давайте разобьем выполнение 
одной инструкции процессора на последовательность отдельных шагов. 


е Извлечение. Устройство управления процессора получает доступ к адресу 
памяти, по которому находится следующая инструкция для выполнения, как 
определено предыдущей инструкцией, либо из предопределенного значения в 
результате сброса программного счетчика сразу после включения питания, 
либо в ответ на прерывание. Считав этот адрес, устройство управления за- 
гружает опкод инструкции во внутренний регистр инструкций процессора. 


е Декодирование. По полученному опкоду устройство управления определяет 
действия, которые необходимо предпринять во время выполнения инструк- 
ции. Эти действия могут включать в себя обращение к АЛУ и потребовать 
доступа к регистрам или ячейкам памяти для чтения или записи. 


е Выполнение. Устройство управления выполняет запрошенную операцию, 
вызывая при необходимости операцию АЛУ. 


» Запись результатов. Устройство управления записывает результаты выпол- 
нения инструкции в регистры или ячейки памяти. После этого в программ- 
ный счетчик загружается адрес следующей инструкции, которая должна быть 
выполнена. 
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Процессор выполняет повторяющийся цикл извлечения, декодирования, выполне- 
ния и записи с момента подачи питания до выключения компьютера. В относитель- 
но простом процессоре, таком как 6502, каждый из этих этапов выполняется про- 
цессором как фактически изолированные последовательные операции. 


С точки зрения программиста, каждая инструкция проходит все эти этапы перед 
началом выполнения следующей инструкции. После завершения записи результаты 
и побочные эффекты каждой инструкции доступны в регистрах, памяти и флагах 
процессора для немедленного использования следующей инструкцией. Это простая 
модель выполнения, и работающие программы могут с уверенностью считать, что 
когда начинается выполнение инструкции, все действия предыдущих инструкций 
завершены. 


Схема на рис. 8.5 является примером выполнения процессором инструкции, для 
каждого из этапов обработки которой (извлечение — декодирование — выполне- 
ние — запись) требуется один тактовый цикл. Обратите внимание, что каждый шаг 
на этой диаграмме обозначен первой буквой названия этапа: И, Д, В или 3. 


Инструкция 
м 


[зи д [8 аз) 
0 1 2 3 4 5 6 7 8 9 10 11 12 


Тактовый цикл 
Рис. 8.5. Последовательное выполнение инструкций 


Для выполнения каждой инструкции требуются четыре такта. На аппаратном уров- 
не процессор, представленный на рис. 8.5, состоит из четырех подсистем выполне- 
ния, каждая из которых становится активной во время одного из четырех тактовых 
циклов инструкции. Логика обработки, связанная с каждым из этих этапов, преду- 
сматривает считывание входной информации из памяти и из регистров процессора 
и сохранение промежуточных результатов в защелках для использования на после- 
дующих этапах выполнения. После завершения выполнения каждой инструкции 
следующая инструкция начинает выполняться в следующем тактовом цикле. 


Количество выполненных инструкций за’такт процессора (шп5гисНоп$ рег с]оск, 
ГРС) представляет собой показатель производительности, характеризующий, на- 
сколько быстро процессор выполняет инструкции относительно своей тактовой 
частоты. Процессору в примере на рис. 8.5 требуется четыре такта на одну инст- 
рукцию, т. е. показатель [РС для него равен 0,25. 


Возможность повышения производительности в этом примере возникает из-за того, 
что схемы, задействованные в каждом из четырех этапов, простаивают, пока вы- 
полняются остальные три этапа. Предположим, что вместо этого, как только схема 
извлечения заканчивает извлечение одной инструкции, она немедленно начинает 
извлечение следующей инструкции. На рис. 8.6 показан процесс, когда аппаратные 
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средства, участвующие в каждом из четырех этапов выполнения инструкции, пере- 
ходят от обработки одной инструкции к следующей на каждом тактовом цикле. 


Инструкция 
1%) 


[ый [13 
0 1 2 3 4 5 6 7 8 9 10 11 12 


Тактовый цикл 
Рис. 8.6. Конвейерное выполнение инструкций 


Эта процедура выполнения называется конвейерной, т. к. инструкции поступают и 
проходят этапы выполнения от начала до конца, подобно изделиям, перемещаю- 
щимся по реальному конвейеру. Конвейер процессора содержит множество инст- 
рукций, одновременно находящихся на различных этапах выполнения. Причина, 
побудившая пойти на это, очевидна из предыдущего примера: процессор теперь 
выполняет одну инструкцию за тактовый цикл, а [РС составляет 1,0, что дает четы- 
рехкратное увеличение скорости по сравнению с моделью выполнения без конвей- 
ерной обработки, представленной на рис. 8.5. Аналогичные уровни повышения 
производительности достигаются при обработке реальных данных с помощью ме- 
тодов конвейеризации. 


Помимо наложения выполнения последовательных инструкций посредством кон- 
вейеризации, могут существовать и другие возможности продуктивного использо- 
вания подсистем процессора, которые в противном случае могут простаивать. Ин- 
струкции процессора делятся на несколько различных категорий, каждая из 
которых требует задействования разных частей схемы процессора. Вот некоторые 
примеры. 


» Инструкции ветвления. Инструкции условного и безусловного ветвления 
управляют программным счетчиком, чтобы установить адрес следующей ин- 
струкции, подлежащей выполнению. 


е Инструкции целочисленных вычислений. Эти инструкции, реализующие 
целочисленную арифметику и побитовые операции, обращаются к целочис- 
ленной части АЛУ. 


» Инструкции вычислений с плавающей запятой. Операции с плавающей 
запятой в процессорах, которые обеспечивают аппаратную поддержку этих 
операций, обычно используют схему, отделенную от целочисленной части 
АЛУ. 


За счет повышения сложности логики планирования инструкций процессора может 
оказаться возможным инициировать выполнение двух инструкций за один и тот же 
тактовый цикл, если они используют независимые ресурсы обработки. Например, 
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обычной практикой является отправление процессорами инструкций вычислений с 
плавающей запятой в математический сопроцессор (НЙоайп? рошё ип, ЕРО) для 
выполнения параллельно с инструкциями без плавающей запятой, которые обраба- 
тываются ядром основного процессора. 


На практике многие современные процессоры содержат несколько копий подсис- 
тем, таких как целочисленные АЛУ, для поддержки одновременного выполнения 
нескольких инструкций. В этой архитектурной парадигме, называемой обработкой 
с множественной выдачей инструкций (ти!@р]е-1551е ргосеззт?), процессор ини- 
циирует выполнение нескольких инструкций одновременно. На рис. 8.7 показан 
пример множественной выдачи, при которой на каждом такте процессора иниции- 
руется выполнение двух инструкций. 


[вид [5 [63] 
:: [ад] а [#3 
а 4 

о: 29 

ира [23 

в [м ад [в [1 


0 1 2 Е 4 5 6 7 8 9 10 1 12 


Тактовый цикл 
Рис. 8.7. Конвейерное выполнение с множественной выдачей инструкций 


Эта модель выполнения удваивает количество инструкций, выполняемых за такт на 
одноканальном конвейере рис. 8.6, что позволяет довести 1РС до 2,0. Данный под- 
ход представляет суперскалярный процессор, который может выдавать (другими 
словами, начинать выполнение) более одной инструкции за такт. Скалярный про- 
цессор, для сравнения, может выдавать только одну инструкцию за такт. Для того 
чтобы прояснить ситуацию: на рис. 8.5 и 8.6 представлено поведение скалярного 
процессора, а на рис. 8.7 — суперскалярная обработка. Суперскалярный процессор 
реализует параллелизм на уровне инструкций (шзбисНоп-еуе| рагаЙе1$т, П.Р) 
для увеличения скорости выполнения. Практически все современные высокопроиз- 
водительные процессоры общего назначения являются суперскалярными. 


Суперконвейеризация 


На примере рассмотренной ранее скалярной, не конвейерной модели обработки, 
представленной на рис. 8.5, мы можем обсудить вопрос выбора тактовой частоты 
процессора. При отсутствии опасений по поводу энергопотребления и рассеивания 
тепла желательно, как правило, использовать максимально возможную тактовую 
частоту процессора. Верхний предел тактовой частоты для процессора на рис. 8.5 
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определяется самым длительным по времени путем через каждую из четырех под- 
систем, участвующих в этапах выполнения инструкций. Различные инструкции мо- 
гут иметь совершенно разные требования к времени выполнения. Например, для 
выполнения инструкции снятия флага процессора требуется совсем небольшое 
время, в то время как для получения выходных данных инструкции 32-разрядного 
деления может потребоваться гораздо больше времени. 


Неэффективно ограничивать общую скорость выполнения инструкций системы на 
основе наихудшего времени выполнения одной инструкции. Вместо этого разра- 
ботчики процессоров изыскивают возможности разбить выполнение сложных ин- 
струкций на некоторое количество последовательных шагов. Этот подход называ- 
ется суперконвейеризацией. Суперконвейеризация состоит в увеличении 
количества этапов конвейера за счет разбиения сложных этапов на множество бо- 
лее простых. Суперконвейеризация — это, по сути, конвейер процессора со многи- 
ми этапами, возможно исчисляющихся десятками. В дополнение к тому, что совре- 
менные высокопроизводительные процессоры являются суперскалярными, они, как 
правило, поддерживают и суперконвейеризацию. 


Разбиение конвейера на большее количество этапов суперконвейера позволяет 
упростить каждый этап, сокращая время, необходимое для выполнения каждого 
этапа. Благодаря быстрее выполняемым этапам можно увеличить тактовую часто- 
ту процессора. Суперконвейеризация обеспечивает увеличение скорости выпол- 
нения инструкций в соответствии с процентным увеличением тактовой частоты 
процессора. 


Наборы инструкций процессоров для компьютеров с сокращенным набором ин- 
струкций (гедисе4 шзёласноп её сотршег, В]$С) разработаны для поддержки эф- 
фективной конвейеризации. Большинство Е]$С-инструкций выполняют простые 
операции, такие как перемещение данных между регистрами и памятью или сложе- 
ние содержимого двух регистров. ЕТ5С-процессоры обычно имеют более короткие 
конвейеры по сравнению с процессорами для компьютеров с полным набором 
инструкций (сотр!ех шзгасноп зе сотшршег, СПС). СГЗС-процессоры и их более 
обширные и сложные наборы инструкций извлекают выгоду из более длинных 
конвейеров, разбивая длительно выполняющиеся инструкции на серию последова- 
тельных этапов. 


По большей части сложность реализации эффективной конвейерной обработки в 
процессорах, использующих устаревшие наборы инструкций, таких как х86, заклю- 
чается в том, что первоначальный набор инструкций не полностью учитывал по- 
тенциал более поздних усовершенствований, таких как суперскалярная обработка и 
суперконвейеризация. В результате в современных х86-совместимых процессорах 
значительная часть площади кристалла выделена для сложной логики, реализую- 
щей эти функции повышения производительности для инструкций, которые не бы- 
ли предназначены для работы в такой среде. 
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Если разбиение конвейера на один или два десятка этапов приводит к существен- 
ному повышению производительности, почему бы не продолжить это разбиение на 
сотни или даже тысячи более мелких этапов, чтобы достичь еще большей произво- 
дительности? Ответ: наличие конфликтов конвейеризации. 


Конфликты конвейеризации 


Реализация конвейерной обработки в процессоре общего назначения не так проста, 
как может показаться из предыдущего обсуждения этой темы. Если результат инст- 
рукции зависит от результата предыдущей инструкции, то текущей инструкции 
приходится ждать, пока не станет доступен результат предыдущей инструкции. 
Рассмотрим следующий код х86: 


1пс еах 
ада ебх, еах 


Предположим, что эти две инструкции выполняются на процессоре, работающем 
как показано на рис. 8.6 (одноканальная конвейеризация). Первая инструкция уве- 
личивает содержимое регистра еах на единицу, а вторая — добавляет полученное 
значение к содержимому регистра ебх. Инструкция ада не может выполнить опера- 
цию сложения до тех пор, пока не будет доступен результат операции увеличения 
на 1 в предыдущей инструкции. Если этап выполнения второй инструкции (обозна- 
ченный как 2:В на рис. 8.6) не может быть выполнен до тех пор, пока не завершит- 
ся этап записи результата первой инструкции (1:3 на рис. 8.6), у этапа 2:В нет дру- 
гого выбора, кроме как дождаться завершения этапа 1:3. Ситуации, подобные этой, 
когда конвейер не может обработать следующий этап выполнения инструкции из- 
за отсутствия необходимой информации, называют конфликтами конвейеризации. 


Одним из способов, с помощью которого конвейеры процессоров решают эту про- 
блему, является использование обходных путей. После завершения этапа выполне- 
ния первой инструкции (обозначенного как 1:В на рис. 8.6), увеличенное на 1 зна- 
чение в регистре еах было вычислено, но еще не было записано в регистр еах. Этапу 
выполнения второй инструкции (2:В на рис. 8.6) в качестве входных данных требу- 
ется увеличенное на 1 значение регистра еах. Если логика конвейера делает резуль- 
тат этапа 1:В доступным для этапа 2:В без предварительной записи в регистр еах, то 
выполнение второй инструкции можно завершить без задержки. Использование 
такого типа упрощения для передачи данных между исходной и целевой инструк- 
циями без ожидания завершения исходной инструкции называется обходом. Обхо- 
ды широко используются в архитектурах современных процессоров, чтобы обеспе- 
чить максимально эффективную работу конвейера. 


В некоторых ситуациях обход невозможен, т. к. нужный результат просто не может 
быть вычислен до того, как целевая инструкция будет готова его использовать. 
В этом случае необходимо приостановить выполнение целевой инструкции и по- 
дождать доставки результата исходной инструкции. Это приводит к тому, что этап 
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выполнения конвейера простаивает, что обычно приводит к распространению пе- 
риода простоя на остальные этапы конвейера. 


Эта распространяющаяся по этапам задержка называется конвейерным пузырем 
по аналогии с воздушным пузырем, проходящим по трубопроводу с жидкостью. 
Наличие пузырей в последовательности обработки снижает эффективность конвей- 
еризации. 


Пузыри плохо влияют на производительность, поэтому разработчики конвейер- 
ных процессоров прилагают значительные усилия, чтобы по возможности избе- 
жать их. Одним из способов сделать это является внеочередное выполнение ин- 
струкций, обозначаемое ОоО (Оц!-оЕ-Огдег шзиисНоп ехесиНоп). Рассмотрим две 
инструкции, упомянутые в предыдущем примере, но теперь за ними следует тре- 
тья инструкция: 


1пс еах 
ада ебх, еах 


поу есх, ейх 


Третья инструкция не зависит от результатов выполнения предыдущих инструк- 
ций. Вместо использования обхода, чтобы избежать задержки, процессор может 
прибегнуть к внеочередному выполнению инструкций для исключения конвейер- 
ного пузыря. Итоговая последовательность выполнения инструкций будет выгля- 
деть следующим образом: 


1пс еах 
том есх, едх 


ада ебх, еах 


Результат выполнения этих трех инструкций один и тот же, но разница во времени 
между первой и третьей инструкциями увеличилась, что снижает вероятность воз- 
никновения конвейерного пузыря, а если он все же возникнет, то такой порядок, по 
крайней мере, сокращает его продолжительность. 


Метод внеочередного выполнения инструкций включает обнаружение зависимо- 
стей между инструкциями и перестраивает порядок их выполнения таким образом, 
чтобы получить те же общие результаты, но не в том порядке, в котором они были 
изначально закодированы. Некоторые процессоры (обычно СТС) выполняют это 
переупорядочивание инструкций в реальном времени во время выполнения про- 
граммы. Другие архитектуры (обычно К!$С) полагаются на интеллектуальные 
компиляторы языков программирования, которые осуществляют перестановку ин- 
струкций в процессе сборки программного обеспечения, чтобы свести к минимуму 
образование конвейерных пузырей. Первый подход требует значительных вложе- 
ний в логику обработки и связанную с ней полезную площадь кристалла для вы- 
полнения переупорядочивания "на лету", в то время как второй подход упрощает 
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логику процессора, но существенно усложняет работу программистов на ассембле- 
ре, которые в этом случае несут ответственность за то, чтобы конвейерные пузыри 
не слишком ухудшали производительность выполнения программы. 


В некоторых С!$С-процессорах для реализации преимуществ по производительно- 
сти, свойственных К]5С-архитектурам, используются микрооперации и переимено- 
вание регистров. Эти методы представлены в следующем разделе. 


Микрооперации и переименование регистров 


Архитектура набора инструкций х86 представляет особую проблему для разработ- 
чиков процессоров. Несмотря на то что история архитектуры х86 насчитывает уже 
несколько десятилетий, она остается основой персональных и коммерческих вычис- 
лений. Так как конфигурация С!$С содержит всего восемь регистров (в 32-разрядной 
версии х86), методы высокоэффективной конвейеризации инструкций и использо- 
вания большого количества регистров, доступных в архитектурах В1$С, гораздо 
менее полезны в оригинальной архитектуре х86. 


Для того чтобы воспользоваться некоторыми преимуществами методики В!$С, 
разработчики процессоров х86 решили представить инструкции х86 в виде после- 
довательностей микроопераций. Микрооперация, сокращенно пор (произносится 
как "майкро-оп"), является подэтапом инструкции процессора. Простые инструк- 
ции х86 разделяются на 1-3 микрооперации, а более сложные — не большее их ко- 
личество. Разделение инструкций на микрооперации обеспечивает более высокий 
уровень детализации для оценки зависимостей от результатов других микроопера- 
ций и поддерживает увеличение параллелизма выполнения. 


Вместе с поддержкой микроопераций современные процессоры обычно предостав- 
ляют дополнительные внутренние регистры (числом в десятки или даже сотни) для 
хранения промежуточных результатов микроопераций. Эти регистры содержат час- 
тично вычисленные результаты, предназначенные для переноса в физические реги- 
стры процессора после завершения всех микроопераций инструкции. Использова- 
ние этих внутренних регистров называется переименованием регистров. Каждый 
переименованный регистр имеет соответствующее значение тега, указывающее, 
какой физический регистр процессора он в итоге займет. За счет увеличения коли- 
чества переименованных регистров, доступных для промежуточного хранения, 
увеличиваются возможности параллелизма инструкций. 


Несколько микроопераций могут находиться на разных стадиях выполнения в лю- 
бой момент времени. Зависимости инструкции от результата предыдущей инструк- 
ции блокируют выполнение микрооперации до тех пор, пока не будут доступны ее 
входные данные, обычно передаваемые с помощью механизма обхода, описанного 
в предыдущем разделе. Как только все необходимые входные данные будут дос- 
тупны, микрооперация будет запланирована для выполнения. 


Этот режим работы представляет собой модель обработки по потоку данных. Та- 
кая обработка позволяет выполнять параллельные операции в суперскалярной ар- 
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хитектуре, инициируя выполнение микроопераций после разрешения любых зави- 
симостей по данным. 


Высокопроизводительные процессоры осуществляют декодирование инструкций в 
микрооперации после извлечения каждой инструкции. В некоторых микросхемах 
результаты этого декодирования хранятся в кеше инструкций уровня 0, располо- 
женном между процессором и !-кешем [.1. [-кеш [.0 обеспечивает максимально бы- 
стрый доступ к предварительно декодированным микрооперациям для выполнения 
внутренних циклов кода с максимально возможной скоростью. Благодаря кеширо- 
ванию декодированных микроопераций процессор избегает необходимости повто- 
рять этапы конвейера, выполняющие декодирование инструкций, для каждого по- 
следующего доступа к одной и той же инструкции. 


В дополнение к конфликтам, связанным с зависимостями по данным между инст- 
рукциями, вторым ключевым источником конфликтов конвейеризации является 
возникновение условного ветвления, обсуждаемого в следующем разделе. 


Условное ветвление 


Условное ветвление вносит существенные затруднения в процесс конвейерной об- 
работки. Адрес инструкции, следующей за инструкцией условного ветвления, не 
может быть подтвержден до тех пор, пока не будет оценено условие ветвления. 


Есть две возможности: если условие ветвления не выполняется, процессор выпол- 
нит инструкцию, которая следует за инструкцией условного ветвления. Если усло- 
вие ветвления выполняется, следующая инструкция находится по адресу, указан- 
ному в инструкции. 


Для решения проблем, связанных с условным ветвлением в конвейерных процессо- 
рах, используется несколько методов. Вот некоторые из них. 


» Когда это возможно, следует вообще избегать ветвления. Разработчики про- 
граммного обеспечения могут разрабатывать алгоритмы с внутренними цик- 
лами, которые сводят к минимуму или вовсе устраняют условный код. Опти- 
мизирующие компиляторы стремятся перестроить и упростить последова- 
тельность операций, чтобы уменьшить негативные последствия условного 
ветвления. 


» Процессор может отложить извлечение следующей инструкции до тех пор, 
пока не будет оценено условие ветвления. Обычно это приводит к образова- 
нию пузырей в конвейере, снижая производительность. 


» Процессор может выполнить вычисление условия ветвления на как можно 
более ранних этапах конвейера. Благодаря этому можно быстрее идентифи- 
цировать правильную ветвь, обеспечивая выполнение с меньшей задержкой. 


» Некоторые процессоры пытаются угадать результат условия ветвления и на- 
чинают предварительное выполнение инструкций по этому угаданному пути. 
Этот метод называется прогнозированием ветвления. Если предположение 
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оказывается неверным, процессор должен удалить результаты неправильно 
выполненных инструкций из конвейера (эта операция называется очисткой 
конвейера) и начать выполнение сначала — с первой инструкции по пра- 
вильному пути. Неверное предположение приводит к значительному снижению 
производительности, однако правильное угадывание направления ветвления 
обеспечивает выполнение без задержек. Некоторые процессоры, в которых 
реализовано прогнозирование ветвления, отслеживают результаты оценок 
условия ветвления и используют эту информацию для повышения точности 
будущих прогнозов при повторном выполнении той же инструкции. 


» При обнаружении инструкции условного ветвления процессор может начать 
выполнение инструкций по обоим путям ветвления одновременно, используя 
свои суперскалярные возможности. Этот подход называется упреждающим 
выполнением. 


После определения условия ветвления результаты выполнения по неправиль- 
ному пути отбрасываются. Упреждающее выполнение может применяться 
только в том случае, если инструкции не вносят изменений, которые нельзя 
отменить. Запись данных в основную память или на устройство вывода явля- 
ется примером изменения, которое нелегко отменить, поэтому упреждающее 
выполнение будет приостановлено, если такое действие произойдет во время 
выполнения по неверному пути. 


Современные высокопроизводительные процессоры выделяют значительную часть 
своих логических ресурсов для поддержки эффективной конвейеризации в самых 
разнообразных условиях обработки. Совокупные преимущества многоядерной, су- 
перскалярной и суперконвейерной обработки обеспечивают впечатляющее повы- 
шение производительности в последних поколениях сложных процессорных архи- 
тектур. Реализуя конвейерную обработку инструкций и выполняя инструкции в 
суперскалярном контексте, эти функции привносят параллелизм в последователь- 
ности кода, изначально не предназначенные для параллельного выполнения. 


Производительность обработки можно дополнительно повысить путем ввода па- 
раллельного выполнения нескольких потоков на одном ядре процессора с исполь- 
зованием одновременной МНОГОПОТОЧНнНоОСТиИ. 


Одновременная многопоточность 


Как мы узнали из предыдущих глав, каждый выполняемый процесс содержит один 
или несколько потоков выполнения. При реализации многопоточности с разделе- 
нием по времени на одноядерном процессоре в любой момент времени в состоянии 
выполнения находится только один поток. Быстро переключаясь между несколь- 
кими готовыми к запуску потоками, процессор создает иллюзию (с точки зрения 
пользователя) одновременного выполнения нескольких программ. 


В этой главе представлена концепция суперскалярной обработки, которая предос- 
тавляет одному процессорному ядру возможность выдавать более одной инструк- 
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ции за такт. Повышение производительности в результате суперскалярной обра- 
ботки может быть ограничено, когда активная последовательность инструкций не 
требует использовать сочетание ресурсов процессора, которое хорошо согласуется 
с возможностями его суперскалярных функциональных блоков. Например, в кон- 
кретной последовательности инструкций могут интенсивно использоваться блоки 
целочисленных вычислений (что приводит к появлению конвейерных пузырей), 
в то время как блоки вычисления адресов в основном простаивают. 


Одним из способов увеличить использование суперскалярных возможностей про- 
цессора является выдача в каждом такте инструкций из более чем одного потока. 
Такой подход называют одновременной многопоточностью. Одновременное вы- 
полнение инструкций из разных потоков повышает вероятность того, что последо- 
вательности инструкций будут зависеть от несовместимых функциональных воз- 
можностей процессора, тем самым обеспечивая повышенный параллелизм 
выполнения и более высокую скорость выполнения инструкций. 


Процессоры, поддерживающие одновременную многопоточность, должны предос- 
тавлять отдельный набор регистров для каждого одновременно выполняющегося 
потока, а также полный набор переименованных внутренних регистров для каждо- 
го потока. Цель здесь состоит в том, чтобы предоставить больше возможностей для 
использования суперскалярных функций процессора. 


Многие современные высокопроизводительные процессоры поддерживают выпол- 
нение двух одновременных потоков, хотя некоторые обеспечивают поддержку до 
восьми таких потоков. Как и в случаях с большинством других методов повышения 
производительности, обсуждаемых в этой главе, увеличение числа одновременных 
потоков, поддерживаемых ядром процессора, в конечном счете достигает точки 
падения эффективности, т. к. одновременные потоки конкурируют за доступ к об- 
щим ресурсам. 


ОДНОВРЕМЕННАЯ МНОГОПОТОЧНОСТЬ, МНОГОЯДЕРНЫЕ 
ПРОЦЕССОРЫ И МНОГОПРОЦЕССОРНОСТЬ 


Понятие одновременной многопоточности относится к ядру процессора, 
способному поддерживать выполнение инструкций из разных потоков 
на одном этапе конвейера в рамках одного тактового цикла. В много- 
ядерном процессоре, в свою очередь, каждое из нескольких процессор- 
и ных ядер, размещенных на одном кремниевом кристалле, выполняет 
\ => инструкции независимо от других ядер и подключается к ним только 
через кеш-память определенного уровня. 


Многопроцессорный компьютер содержит несколько интегральных 
схем процессора, каждая из которых обычно входит в состав отдельно- 
го пакета интегральных схем. В качестве альтернативы многопроцес- 
сорный компьютер можно реализовать в виде нескольких микросхем 
процессоров, собранных в одном корпусе. 
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Обсуждавшиеся до сих пор методы оптимизации направлены на повышение произ- 
водительности скалярной обработки данных. Это означает, что каждая последова- 
тельность инструкций работает с небольшим числом значений данных. Даже 
суперскалярная обработка, реализованная в сочетании с одновременной многопо- 
точностью или без нее, направлена на ускорение выполнения инструкций, которые 
обычно в каждый момент времени работают с одним или двумя элементами данных 
размером с регистр. 


При обработке векторных данных одна и та же математическая операция выполня- 
ется над каждым элементом массива значений данных одновременно. Особенности 
архитектуры процессора, улучшающие параллелизм выполнения операций вектор- 
ной обработки, рассматриваются в следующем разделе. 


Модель обработки $1МО 


Процессоры, которые выдают за такт одну инструкцию без элементов данных или с 
одним или двумя элементами данных, называют скалярными процессорами. Про- 
цессоры, способные выполнять несколько инструкций за такт, но не выполняющие 
в явном виде инструкции векторной обработки, называются суперскалярными 
процессорами. Некоторые алгоритмы выигрывают от подхода к выполнению, явно 
ориентированного на векторную обработку, т. е. от одновременного выполнения 
одной и той же операции над многими элементами данных. Инструкции процессо- 
ра, адаптированные к таким задачам, называют инструкциями, реализующими мо- 
дель обработки с одним потоком инструкций и множеством потоков данных 
(зтёе шугасноп, тшШире даа, $1МО). 


Одновременно выдаваемые инструкции в суперскалярных процессорах обычно ре- 
шают разные задачи с разными данными, представляя модель параллельной обра- 
ботки с множеством потоков инструкций и множеством потоков данных (тчу]|- 
Ире шугасНоп, шире даа, МПМО). Некоторые операции обработки, такие как 
используемая в цифровой обработке сигналов операция скалярного произведения, 
описанная в главе 6, выполняют одну и ту же математическую операцию над мас- 
сивом значений. 


Операция умножения с накоплением (ти@р/у ассити же, МАС), также описанная 
в главе б, последовательно выполняет скалярные математические операции над ка- 
ждой парой элементов вектора. Также можно разработать схемные решения про- 
цессоров и инструкции, способные выполнять аналогичные операции более чем 
над одной парой чисел одновременно. 


В современных процессорах предусмотрены 51МО-инструкции для выполнения 
таких задач, как математические операции с числовыми массивами, обработка гра- 
фических данных и поиск подстрок в символьных строках. 


Разработанные компанией шк! средства расширения потоковой обработки на осно- 
ве модели ЗПМО — $геапите 5ПМО Ежепз!0п$ (55Е), внедренные в процессорах 
Репнит Ш 1999 г., представляют собой набор инструкций и средств выполнения 
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для одновременной обработки 128-битных массивов данных. Данные, содержащие- 
ся в массиве, могут состоять из целых чисел или значений с плавающей запятой. 
Инструкции $55Е второго поколения (55Е2) могут параллельно обрабатывать дан- 
ные следующих типов: 


» два 64-битных значения с плавающей запятой; 


четыре 32-битных значения с плавающей запятой; 
» два 64-битных целых значения; 

» четыре 32-битных целых значения; 

е восемь 16-битных целых значений; 

е шестнадцать 8-битных целых значений. 


$5Е2 предоставляет инструкции вычислений с плавающей запятой для знакомых 
математических операций сложения, вычитания, умножения и деления. 


Также доступны инструкции для вычисления квадратного корня, обратной величи- 
ны, обратной величины квадратного корня и возврата максимального значения сре- 
ди элементов массива. Инструкции целочисленных вычислений из 55Е2 реализуют 
операции сравнения, побитовые операции, перетасовку данных и преобразование 
типов данных. 


В более поздних поколениях набора инструкций 55Е увеличены размер данных и 
разнообразие поддерживаемых операций. Последняя итерация возможностей типа 
ЗЕ (по состоянию на 202] г.) нашла выражение в виде набора расширений для 
усовершенствованных векторных вычислений АУХ-512. АУХ расшифровывается 
как адуапсед уесог ех{еп$10п$ и обеспечивает поддержку регистров разрядностью 
512 бит. В состав АУХ-512 включены, среди прочего, инструкции, оптимизирован- 
ные для поддержки алгоритмов нейронных сетей. 


Одно из препятствий на пути широкого внедрения различных поколений инструкций 
5ъЕ и АУХ заключается в том, что для их применения конечными пользователями 
эти инструкции должны быть реализованы в процессоре, операционная система 
должна поддерживать их, а компиляторы и другие аналитические инструменты для 
пользователей должны использовать возможности 55Е. Исторически так сложилось, 
что после введения новых инструкций процессора требовались годы, прежде чем ко- 
нечные пользователи могли легко использовать все их преимущества. 


5МО-инструкции, доступные в современных процессорах, по-видимому, нашли 
свое наиболее масштабное применение в области научных вычислений. Исследова- 
телям, работающим с комплексным моделированием, алгоритмами машинного 
обучения или сложным математическим анализом, наличие инструкций $5Е и АУХ 
дает возможность значительно повысить производительность кода, выполняющего 
обширные математические операции, манипуляции с символами и другие вектор- 
но-ориентированные задачи. 


258 Глава 8 


Резюме 


Большинство современных 32- и 64-разрядных процессоров сочетают в себе значи- 
тельную часть или даже все методы повышения производительности, представлен- 
ные в этой главе. Типичный персональный компьютер или смартфон потребитель- 
ского класса содержит единственную интегральную схему основного процессора с 
четырьмя ядрами, каждое из которых поддерживает одновременную многопоточ- 
ность с двумя потоками. Этот процессор является суперскалярным, суперконвейер- 
ным и использует три уровня кеш-памяти. Процессор декодирует инструкции в 
микрооперации и выполняет сложное прогнозирование ветвления. 


Методы, представленные в этой главе, могут показаться слишком сложными и труд- 
ными для понимания, однако в реальности каждый из нас регулярно применяет их и 
получает реализуемые ими преимущества в производительности каждый раз, когда 
мы пользуемся вычислительными устройствами любого типа. Логика обработки, не- 
обходимая для внедрения конвейеризации и суперскалярных операций, несомненно, 
сложна, но производители полупроводников прилагают усилия для реализации этих 
функций по одной простой причине: это окупается производительностью их изделий 
и итоговой ценностью этих продуктов в восприятии их клиентов. 


В этой главе были представлены основные методы повышения производительно- 
сти, используемые в процессорах и компьютерных архитектурах для достижения 
максимальной скорости выполнения в реальных вычислительных системах. Эти 
методы никоим образом не изменяют то, что процессор выдает на выходе; они про- 
сто помогают быстрее выполнять его работу. Мы рассмотрели наиболее важные 
методы повышения производительности систем, включая использование кеш- 
памяти, конвейерную обработку инструкций, одновременную многопоточность и 
модель обработки ЭПМО. 


Следующая глава посвящена расширениям, обычно реализуемым на уровне набора 
инструкций процессора с целью предоставления системам дополнительных воз- 
можностей помимо общих требований к обработке данных. 


Среди расширений, обсуждаемых в главе 9, — привилегированные режимы про- 
цессора, арифметика с плавающей запятой, управление питанием и управление 
безопасностью системы. 


Упражнения 


1. Рассмотрим [-кеш Г с прямым отображением размером 32 Кбайт. Каждая стро- 
ка кеша состоит из 64 байт, а системное адресное пространство составляет 
4 Гбайт. Сколько битов отведено для тега этого кеша? Биты с какими номерами 
(бит 0 — наименее значимый бит) составляют адресное слово? 


2. Рассмотрим 8-канальный наборно-ассоциативный кеш инструкций и данных [2 
объемом 256 Кбайт с 64 байтами в каждой строке кеша. Сколько наборов ис- 
пользуется в этом кеше? 
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3. Процессор имеет 4-этапный конвейер с максимальными задержками 0,8; 0,4; 0,6 
и 0,3 нс на этапах 1-4 соответственно. Если первый этап заменить двумя этапа- 
ми с максимальными задержками 0,5 и 0,3 нс, соответственно, насколько увели- 
чится тактовая частота процессора в процентном выражении? 


Специализированные расширения 
процессоров 


В предыдущих главах мы обсуждали особенности вычислительных архитектур об- 
щего назначения и некоторые архитектурные специализации, предназначенные для 
учета требований определенных предметных областей. Эта глава посвящена рас- 
ширениям, обычно реализуемым на уровне набора инструкций процессора и в дру- 
гих аппаратных средствах вычислительной системы с целью предоставления до- 
полнительных возможностей помимо общих требований к обработке данных. 


Прочитав эту главу, вы получите представление о назначении привилегированных 
режимов процессора и особенностях их работы в многопроцессорных и многополь- 
зовательских контекстах. Вы ознакомитесь с концепциями процессоров и наборов 
инструкций для вычислений с плавающей запятой, методами управления питанием 
в устройствах с аккумуляторным питанием, а также с функциями процессора и сис- 
темы, повышающими уровень безопасности. 


В этой главе мы обсудим следующие расширения процессора и системные функции: 
® привилегированные режимы процессора; 
» арифметика с плавающей запятой; 
® управление питанием; 


® управление безопасностью системы. 
Технические требования 
Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 


В@р5://овиБ.сот/РаскРиБ 5 В то/Модегп-Сотрщег-АгспИесвшге-апд- 
ОграшлаНоп-Зесопд-ЕЗ п. 
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Привилегированные режимы процессора 


Большинство операционных систем, работающих на 32- и 64-разрядных процессо- 
рах, управляют доступом к системным ресурсам, используя концепцию уровней 
привилегий. Основными причинами управления доступом таким образом являются 
повышение стабильности системы, предотвращение несанкционированного взаи- 
модействия с системными аппаратными средствами и предотвращение несанкцио- 
нированного доступа к данным. 


Привилегированное выполнение повышает стабильность системы, гарантируя, что 
только доверенному коду разрешено выполнять инструкции, которые обеспечива- 
ют неограниченный доступ к ресурсам, таким как регистры конфигурации процес- 
сора и устройства ввода-вывода. Ядро операционной системы и связанные с ним 
модули, включая драйверы устройств, требуют привилегированного доступа для 
выполнения своих функций. Так как любой сбой процесса ядра или драйвера уст- 
ройства, вероятнее всего, приведет к немедленной остановке работы всей системы, 
перед выпуском для общего использования эти программные компоненты обычно 
проходят процесс тщательного проектирования и подвергаются строгому тестиро- 
ванию. 


Запуск операционной системы в привилегированном контексте предотвращает дос- 
туп неавторизованных приложений к управляемым системой структурам данных, 
таким как таблицы страниц и таблицы векторов прерываний. Случайно или в ре- 
зультате злого умысла пользовательское приложение может попытаться получить 
доступ к данным, находящимся в системной памяти или в памяти, принадлежащей 
другому пользователю. Механизмы управления доступом к системе предотвраща- 
ют эти попытки и информируют неправильно работающее приложение о наруше- 
нии правил, инициируя исключение, обычно приводящее к завершению работы 
программы с сообщением об ошибке. 


В главе 3 были представлены концепции, связанные с прерываниями и их обработ- 
кой процессором. Прежде чем углубиться в детали привилегированных режимов 
процессора, мы обсудим обработку прерываний и исключений более подробно. 


Обработка прерываний и исключений 


Аппаратные прерывания, как мы видели, позволяют процессорам быстро реагиро- 
вать на запросы обслуживания от периферийных устройств. Аппаратное прерыва- 
ние уведомляет процессор о необходимости предпринять какое-либо действие, 
обычно связанное с передачей данных на внешнее устройство или от него. 


Исключения аналогичны прерываниям с той лишь разницей, что исключения 
обычно связаны с реакцией на некоторые условия, возникающие внутри процессо- 
ра. Одним из примеров внутреннего исключения является деление на ноль. 


Код пользовательского уровня может намеренно генерировать исключения. На 
практике это стандартный метод, используемый непривилегированным кодом для 
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запроса системных сервисов, предоставляемых привилегированным кодом в ядре 
операционной системы и драйверах устройств. 


Невозможно точно сформулировать различие между терминами "прерывание" и 
"исключение". Обработка прерываний и обработка исключений обычно зависят 
от одних и тех же или подобных аппаратных ресурсов процессора, работающих 
практически одинаково. В архитектуре х86 инструкция, которая инициирует про- 
граммно-генерируемое прерывание (или исключение), обозначается как 1п+ — со- 
кращение от йиеггир! (прерывание). 


Исключения могут возникать в результате ошибок, возникающих во время выпол- 
нения программ, таких как деление на ноль, а также в ситуациях, не связанных с 
ошибками, таких как отказы страниц. Если прерывание или исключение не приво- 
дят к радикальной реакции в виде прекращения работы приложения, процедура об- 
служивания прерывания или обработчик исключений обрабатывает событие и воз- 
вращает управление системному планировщику, который в конечном счете 
возобновляет выполнение прерванного потока. 


При возникновении прерывания или исключения процессор передает управление 
соответствующему обработчику следующим образом. 


Когда происходит прерывание, процессор разрешает завершить выполнение теку- 
щей инструкции, а затем передает управление процедуре обслуживания преры- 
вания (пиеггир: зегусе гоийпе, [5К). Код в [ЗК осуществляет обработку, необходи- 
мую для выполнения запроса, инициированного прерыванием. После завершения 
15В выполнение прерванного кода возобновляется. Эти действия выполняются без 
ведома или подтверждения со стороны каких-либо потоков, которые, возможно, 
выполнялись во время прерывания. 


При реагировании на исключение процессор передает управление процедуре обра- 
ботки исключений, которая во многом похожа на 13. Во время выполнения инст- 
рукции может возникнуть исключение, препятствующее завершению операций ин- 
струкции. Если выполнение инструкции прерывается из-за исключения, та же 
инструкция будет перезапущена после завершения работы обработчика исключе- 
ний и возобновления выполнения потока. Этот механизм допускает возникновение 
отказов страниц в любой момент во время выполнения программы без влияния на 
результаты, полученные программой (кроме введения задержки из-за обработки 
отказа страницы). 


Каждый тип прерывания или исключения имеет номер вектора, ссылающийся на 
строку в таблице векторов системных прерываний. При возникновении прерывания 
или исключения аппаратные средства процессора обращаются к таблице векторов 
прерываний (ииеггирЕ уестог {аЫе, ТУТ) для выбора соответствующей процедуры 
обслуживания прерывания (15К) или обработчика исключений. Строка таблицы 
векторов прерываний, соответствующая номеру вектора, содержит адрес процеду- 
ры обслуживания прерывания или обработчика для этого вектора. 


При обработке прерывания или исключения процессор помещает любую необхо- 
димую контекстную информацию в стек и передает управление обработчику. 
В случае прерывания обработчик обслуживает устройство и удаляет его запрос на 
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прерывание. После обработки прерывания или исключения обработчик возвращает 
управление операционной системе. В случае исключения это может повлечь за со- 
бой перезапуск инструкции, которая выполнялась в момент возникновения исклю- 
чения. 


В табл. 9.1 приведены некоторые типы прерываний и исключений, используемых в 
процессорах х86, работающих в защищенном режиме. 


Таблица 9.1. Пример типов прерываний и исключений в х86 


Ошибка деления Инструкция 491% или 141, предприняла попытку цело- 
численного деления на ноль 


Немаскируемое Был получен аппаратный сигнал ММ! 
прерывание 


й. 
Контрольная точка | Выполнена инструкция 11 3 


Недопустимый код |Была предпринята попытка выполнить зарезервирован- 
операции ный код операции 


| Общая защита Была предпринята попытка запрещенного доступа к 
памяти или системному ресурсу 


4 ММИ выдал запрос на трансляцию виртуального адреса 


32-255 | Определяются поль- | Эти векторы доступны для использования аппаратными 
зователем прерываниями или с помощью инструкции 11% 


Отметим некоторые интересные детали, связанные с прерываниями и исключения- 
ми, указанными в табл. 9.]. 


» Работа входного сигнала ММП по вектору 2 аналогична входу ММГ процессо- 
ра 6502, рассмотренному в главе 3. 


® Современные процессоры предоставляют развитые возможности использова- 
ния контрольных точек, не нарушающие работу системы, однако архитектура 
х86 сохраняет функциональность контрольной точки, предоставляемую инст- 
рукцией 1п* 3 с самых первых дней существования процессора 8086. Как бы- 
ло показано в главе 3, механизм, используемый отладчиками программного 
обеспечения процессора 6502 для прерывания выполнения программы по 
указанному адресу, заключается во временной замене кода операции в месте 
прерывания на опкод ввк. Когда выполнение программы достигает этого мес- 
та, обработчик ввк берет на себя управление, чтобы предоставить пользовате- 
лю возможность взаимодействовать с системой. Инструкция 1т{ 3 в архитек- 
туре х86 функционирует таким же образом. 


» В отличие от инструкции 1т* процессоров х86, используемой с любыми дру- 
гими номерами векторов, инструкция 1п* 3 реализована в виде однобайтового 
опкода со значением ссн. Программное прерывание с другим вектором, на- 
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пример 1пЕ 32, представляет собой двухбайтовую инструкцию. Инструкция 
41 3 позволяет вставлять контрольную точку путем замены одного байта ко- 
да значением ссн. 


» Вектор 13, обработчик исключений общей защиты, активируется при любой 
попытке приложения получить доступ к памяти или системному ресурсу, не 
выделенному для такого использования. В современных операционных сис- 
темах системный обработчик для этого вектора завершает работу запущенно- 
го приложения и отображает сообщение об ошибке. 


» Вектор 14, обработчик отказов страниц, срабатывает, когда приложение пыта- 
ется получить доступ к допустимой странице, которая отсутствует в физиче- 
ской памяти. Этот обработчик пытается найти указанную страницу, которая 
может находиться в файле на диске или в системном файле подкачки, загружа- 
ет страницу в память, обновляет таблицы трансляции виртуальных адресов в 
физические и перезапускает инструкцию, которая вызвала исключение. 


Подводя итог, можно сказать, что аппаратные прерывания инициируются устрой- 
ствами ввода-вывода, нуждающимися в передаче данных или других видах обслу- 
живания. Исключения возникают, когда выполнение последовательности инструк- 
ций должно быть приостановлено для обработки такого условия, как отказ 
страницы или попытка несанкционированного доступа к памяти. 


Аппаратные прерывания, как правило, происходят в случайные моменты времени 
относительно текущего выполнения кода программы, в то время как поведение, 
связанное с исключениями, генерируемыми программным образом, часто повторя- 
ется, если тот же код выполняется снова при работе с теми же данными. 


Некоторые исключения, такие как ошибка общей защиты, приводят к завершению 
процесса, вызвавшего исключение, но большинство прерываний и исключений за- 
канчиваются возобновлением выполнения прерванного потока после того, как об- 
работчик прерывания или исключения завершил свою работу. 


ИСКЛЮЧЕНИЯ В ЯЗЫКАХ ПРОГРАММИРОВАНИЯ 


„Многие языки программирования предоставляют средства для обработ- 

_ ки исключений в приложениях. Такие исключения существенно отли- 

‚ чаются от исключений, обрабатываемых на уровне процессора. Исклю- 

„ чения в языках программирования обычно связаны с ошибками на 

_ гораздо. более высоком концептуальном уровне, чем исключения, обра- 
‘батываемые | аппаратными средствами процессора. 


Например, С++ генерирует (или "выдает", в терминологии С++) исклю- 
‚ чение при неудачном запросе на выделение памяти. Это исключение 
_ совсем другого типа по сравнению с системными исключениями, обра- 
батываемыми на уровне процессора. Будьте внимательны и не путайте 
__ исключения в языках программирования высокого уровня с исключе- 
_ НИЯМи, ‘обрабатываемыми непосредственно процессором. 
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Кольца защиты 


Стратегия защиты, применяемая в современных процессорах и операционных сис- 
темах, в чем-то похожа на систему обороны, нашедшую воплощение в устройстве 
средневековых замков. Замок обычно имеет высокую стену, окружающую его тер- 
риторию, иногда дополненную рвом. В этой внешней стене имеется небольшое ко- 
личество хорошо защищенных проходов, каждый из которых защищен от зло- 
умышленников такими механизмами, как разводные мосты и круглосуточная 
охрана. Сам замок, расположенный на огороженной стеной территории, также име- 
ет крепкие стены и небольшое количество хорошо защищенных проходов, что еще 
больше ограничивает доступ к наиболее уязвимым местам. 


Самые привилегированные члены замковой иерархии имеют неограниченные права 
на вход и выход из замка и проход через внешнюю стену. Менее привилегирован- 
ные члены общества могут иметь разрешение на проход внутрь через внешнюю 
стену, но им запрещен доступ непосредственно в замок. Наименее привилегиро- 
ванным представителям местного населения в большинстве случаев запрещено 
входить в замок, а в тех случаях, когда доступ им разрешен (например, в опреде- 
ленные общественные зоны), они должны принять ограничения в отношении того, 
что им позволено делать. 


Защиту, обеспечиваемую этой стратегией, можно представить в виде концентриче- 
ских колец, при этом для доступа к внутренним кольцам требуются самые высокие 
привилегии, а внешнее кольцо представляет собой область, требующую наимень- 
ших привилегий, как показано на рис. 9.1. 


Кольцо 2 


Кольцо 1 


Кольцо 0 
Замок 


Огороженная 
территория 


Окружающая 
местность 


Рис. 9.1. Пример защитных колец 


Эта стратегия защиты реализует три уровня привилегий, которые определяют типы 
доступа для всех пользователей системы. Кольцо 0 требует самого высокого уровня 
привилегий, а кольцо 2 не требует особых привилегий. 
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Современные процессоры и работающие на их основе операционные системы. ис- 
пользуют очень похожий подход ДЛЯ предотвращения несанкционированного дос- 
тупа к критическим ресурсам и предоставления непривилегированным пользовате- 
лям доступа к возможностям системы, одобренным для их использования. 


В принципе, можно создать несколько промежуточных уровней между кольцами с 
наивысшими и низшими привилегиями, однако в большинстве современных ком- 
пьютерных систем реализованы только два кольца: привилегированное кольцо, на- 
зываемое ядром или супервизором, и непривилегированное пользовательское коль- 
цо. В некоторых операционных системах имеется промежуточное кольцо, которое 
содержит драйверы устройств и предоставляет доступ к ресурсам, необходимым 
для взаимодействия с устройствами ввода-вывода, но не обеспечивает беспрепятст- 
венного общесистемного доступа в кольцо ядра. 


Одна из причин, по которой операционные системы, такие как У/тдо\$ и Глпих, 
поддерживают только два кольца привилегий, заключается в том, что при проекти- 
ровании этих систем ставилась задача переносимости на различные процессорные 
архитектуры. Некоторые процессоры поддерживают только два кольца привилегий, 
но есть и другие, которые поддерживают большее количество колец. Переносимая 
операционная система не может реализовать более двух колец привилегий, если 
архитектура какого-либо из базовых процессоров не поддерживает желаемое коли- 
чество колец. Архитектура х86, например, поддерживает до четырех колец, но в 
УИпдо\$ и Ипиах используются только два из них (кольцо 0 с наибольшими приви- 
легиями и кольцо 3 с наименьшими привилегиями). 


На рис. 8.2 представлена кольцевая организация большинства операционных сис- 
тем, работающих на архитектуре х86. 


Кольцо 3 


Кольцо 0 
Ядро и 
драйверы 
устройств 


Приложения 
пользовательского режима 
(непривилегированные) 


Рис. 9.2. Кольца защиты в операционных системах х86 


Кольцевая система управления привилегиями является основной причиной того, 
что печально известный "синий экран смерти" У/тдо\з, который был распростра- 
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нен в 1990-х годах, так редко появляется у пользователей последних версий 
\п4до\$. Пользовательские приложения, такие как веб-браузеры, почтовые клиен- 
ты и текстовые редакторы, иногда сталкиваются с проблемами, которые приводят к 
аварийному завершению их работы. Благодаря двухуровневому механизму приме- 
нения привилегий, предоставляемому современными операционными системами, 
такими как \тдо\з, Глпих, тасО$ и Апаго!4, ущерб от сбоя в работе отдельного 
приложения сдерживается операционной системой, не позволяя ему повлиять на 
саму операционную систему или любую другую программу, запущенную в системе 
(по крайней мере, на те программы, которые не зависят от корректной работы про- 
граммы, в которой произошел сбой). 


После аварийного завершения работы приложения операционная система очищает 
все ресурсы, использовавшиеся отказавшей программой, включая выделенные 
страницы памяти и открытые файлы. Благодаря этому компьютерные системы, та- 
кие как веб-серверы, могут непрерывно работать в течение сотен дней, несмотря на 
периодические сбои и перезапуски работающих на них программных приложений. 


Помимо защиты от сбоев приложений, управление привилегиями на основе колец 
дает существенные преимущества в области защиты от злоумышленников. Один из 
типов атак, которые может попытаться предпринять хакер, — вставить некоторый 
код в системный модуль, работающий в кольце 0. Такая вставка может произойти в 
исполняемый файл на диске, или злоумышленник может попытаться изменить код 
ядра во время его работы в памяти. В случае успеха злоумышленник может исполь- 
зовать этот код для доступа к данным в любой части системы, поскольку он рабо- 
тает в кольце 0. 


Успех такой атаки не является чем-то невозможным, однако в современных про- 
цессорах и операционных системах реализован обширный набор мер безопасно- 
сти и устранены многие уязвимости, присутствовавшие в ранних версиях опера- 
ционных систем. Когда системные администраторы и пользователи в полной мере 
используют преимущества средств защиты на основе колец, доступных в совре- 
менных компьютерных системах, у злоумышленника остается очень мало воз- 
можных путей для получения доступа к защищенным данным. Действительно, 
в большинстве случаев ключевым элементом успешных взломов, о которых со- 
общают в наши дни в новостях, является нарушение правил безопасности челове- 
ком, которое использовал в своих целях злоумышленник. Мы обсудим киберугро- 
зы и методы обеспечения безопасности системного и прикладного программного 
обеспечения позже в разд. "Управление безопасностью системы" этой главы, а так- 
же в главе 14. 


Режим супервизора и режим пользователя 


В двухуровневой иерархии защиты на основе колец уровень защиты выполняемого 
потока представлен битом в реестре. При работе в кольце 0 бит режима суперви- 
зора имеет значение 1, а при работе в режиме пользователя (кольцо 3 в х86) этот 
бит равен 0. Бит режима супервизора может быть изменен только кодом, работаю- 
щим в режиме супервизора. 
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Состояние этого бита определяет, какие инструкции доступны для выполнения по- 
током. Инструкции, которые могут помешать работе системы, например инструк- 
ция №14 в х86б, которая останавливает выполнение инструкций процессора, недос- 
тупны в режиме пользователя. 


Любая попытка выполнить запрещенную инструкцию приводит к сбою общей за- 
щиты. В режиме пользователя доступ инструкций к областям системной памяти и 
памяти, выделенной другим пользователям, запрещен. В режиме супервизора все 
инструкции доступны для выполнения, и также доступны все области памяти. 


В аналогии с замком бит режима супервизора представляет собой предоставляемое 
охранникам замка разрешение, открывающее доступ на территорию замка и в сам 
замок. Установленный бит режима супервизора предоставляет вам ключи от коро- 
левства. 


Системные вызовы 


Весь код, относящийся к ядру и драйверам устройств, всегда работает в кольце 0. 
Весь пользовательский код всегда выполняется в кольце 3, даже для пользователей 
с повышенными привилегиями в операционной системе, таких как системные ад- 
министраторы. Код, выполняющийся в кольце 3, строго контролируется системой и 
не может напрямую выполнять какие-либо действия, связанные с выделением па- 
мяти, открытием файла, выводом информации на экран или взаимодействием с 
устройством ввода-вывода. Для того чтобы получить доступ к любой из этих сис- 
темных функций, пользовательский код кольца 3 должен отправить в ядро запрос 
на обслуживание. 


Этот запрос на обслуживание должен сначала пройти через "ворота" (как посетите- 
ли, входящие в наш замок), где тип запрашиваемой операции, а также все связан- 
ные с ней параметры проходят тщательную проверку и утверждение, прежде чем 
будет выдано разрешение на выполнение операции. Выполняющий запрошенную 
операцию код запускается в режиме супервизора в кольце 0 и по завершении во3з- 
вращает управление в режим пользователя в кольце 3. 


В ранних версиях У тдо\$ (до \Мшдо\з ХР) для запроса системных услуг прило- 
жение использовало механизм программного прерывания с вектором 2еп. Протокол 
вызова системного сервиса включал в себя помещение в регистры процессора па- 
раметров, необходимых для запрашиваемого сервиса, и выполнение инструкции 
1пе 2е', инициирующей программное прерывание. Обработчик работал в режиме 
супервизора, что приводило к переходу от кольца 3 к кольцу 0. После завершения 
работы обработчика система возвращалась к кольцу 3 для выполнения инструкции, 
следующей за 1п% 2ен. 


Одна из проблем, связанных с использованием механизма ни 2ев для запроса услуг 
ядра, заключается в его невысокой эффективности. Действительно, требуется более 
1000 тактовых циклов процессора, чтобы пройти путь от точки, в которой выполня- 
ется инструкция ше 2ер, до кода ядра, который начинает обрабатывать это исключе- 
ние. Загруженная система может запрашивать услуги ядра тысячи раз в секунду. 
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Для решения этой проблемы шк! внедрила в архитектуре х86, начиная с процессо- 
ра Репнит П в 1997 г., инструкции зузепеег и зузеха*. Их цель заключалась в уско- 
рении процесса перехода из кольца 3 в кольцо 0, а затем возврата в кольцо 3. За 
счет использования этих инструкций вместо 1л* 2ей процесс перехода в режим ядра 
и возвращение из него ускоряется примерно в три раза. 


Примерно в то время, когда компания шп начала выпускать процессоры с инст- 
рукциями зузепеег и 5узех1{, АМО выпустила инструкции $узса]1 и зузгеё в своих 
процессорных архитектурах с той же целью повышения производительности. К со- 
жалению, инструкции в процессорных архитектурах | и АМО несовместимы, 
в результате чего к операционным системам предъявляется требование различать 
архитектуры при использовании инструкций для ускорения вызова сервисов ядра. 


В следующем разделе мы рассмотрим форматы данных и операции, связанные с 
арифметикой с плавающей запятой. 


Арифметика с плавающей запятой 


Современные процессоры обычно поддерживают целочисленные типы данных раз- 
рядностью 8, 16, 32 и 64 бита. Некоторые небольшие встраиваемые процессоры 
могут не поддерживать 64-битные или даже 32-битные целые числа напрямую, в то 
время как более сложные устройства способны поддерживать 128-битные целые 
числа. Целочисленные типы данных подходят для использования в широком спек- 
тре приложений, но многие области вычислений, особенно в сфере науки, инже- 
нерного дела и навигации, требуют возможности с высокой степенью точности 
представлять дробные числа. 


В качестве простого примера ограничений целочисленной математики предполо- 
жим, что вам нужно разделить 5 на 3. На компьютере, ограниченном использовани- 
ем только целых чисел, вы можете выполнить целочисленное вычисление этого 
выражения, используя следующий код на языке С+-: 


#1пс1и4де <1о0$геат> 


11 та1п(\о1а) 


{ 
ТА а = 5% 
11% Ь = 3; 
Е с=а/Ь; 
544: : сои << "с = " << с << $4: :епа1; 
гефигп 0; 
} 


Эта программа выдает следующий результат: 


С \ 
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Если вы введете это выражение в карманный калькулятор, то обнаружите, что ре- 
зультат, полученный программой, не слишком близок к фактическому результату, 
который составляет примерно 1,6667. В вычислительных приложениях, где требу- 
ются точные вычисления с действительными числами, практическое решение пред- 
лагает арифметика с плавающей запятой. 


С точки зрения математики, множество действительных чисел состоит из всех чи- 
сел, включая все целые и дробные числа, расположенные на числовой прямой от 
отрицательной бесконечности до положительной бесконечности. Количество цифр 
в целой и дробной частях действительного числа не ограничено. 


Учитывая ограниченный объем памяти, доступный даже в самом большом компью- 
тере, очевидно, что в компьютерных программах невозможно представить весь 
диапазон действительных чисел. Если мы хотим представлять действительные чис- 
ла полезным образом, необходим компромисс. Стандартным решением является 
представление действительных чисел с помощью мантиссы и порядка. 


В областях знаний, связанных с математикой очень больших или очень малых чи- 
сел, принято представлять такие числа в виде мантиссы и порядка. Например, в фи- 
зике гравитационная постоянная представлена в следующем формате: 

3 


им 
С=6,674х10" —. 

кг. с 
Мантисса представляет собой ненулевые цифры числа после умножения на мас- 
штабный коэффициент, который помещает эти цифры в удобный диапазон. Поря- 
док представляет собой масштабный коэффициент, на который необходимо умно- 


жить мантиссу для получения фактического значения. 


В этом примере мантисса составляет 6,674, а порядок равен —11. В данном примере 
используется десятичная мантисса, что удобно для ручных расчетов, поскольку ум- 
ножение на масштабный коэффициент 10`'' можно выполнить, просто переместив 
положение десятичной запятой мантиссы. В этом примере порядок —11 требует пе- 
ремещения десятичной запятой на 11 мест влево, что дает эквивалентное значение 
С = 0,00000000006674. 


Применение нотации с плавающей запятой позволяет избежать ошибок, связанных 
с использованием длинных последовательностей нулей, и дает возможность пред- 
ставлять как очень большие, так и очень малые числа в компактном формате. 


В нотации с плавающей запятой можно представить любое число на линии дейст- 
вительных чисел. Однако, если целью является представление всех действительных 
чисел, не должно быть ограничений по количеству цифр в мантиссе или порядке. 


В компьютерных представлениях чисел с плавающей запятой и мантисса, и поря- 
док ограничены предопределенной шириной битового поля. Эти диапазоны выби- 
раются таким образом, чтобы числа с плавающей запятой укладывались в стан- 
дартную разрядность данных, обычно 32 или 64 бита, обеспечивая при этом 
достаточное количество разрядов мантиссы и порядка для широкого спектра прак- 
тических задач. 
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Увеличение числа разрядов мантиссы повышает точность числовых значений, вос- 
производимых в формате с плавающей запятой. Увеличение числа цифр порядка 
увеличивает диапазон чисел, которые могут быть представлены. Из-за конечной 
длины мантиссы и порядка результат вычислений с плавающей запятой часто не 
соответствует реальному результату. Вместо этого лучший исход в такой ситуации 
заключается в том, что результат с плавающей запятой будет ближайшим предста- 
вимым значением к правильному результату. 


Современные процессоры обычно поддерживают 32- и 64-битное представление 
чисел с плавающей запятой. Вместо десятичного порядка, описанного в предыду- 
щем примере, компьютеры работают с порядком по основанию 2. Общий формат 
компьютерного числа с плавающей запятой: 


знак Хх мантисса х 2"°РЯЛоК, 


Знак — это просто +1 или -1. В двоичном представлении положительное число 
имеет знаковый бит, равный 0, а отрицательное число — знаковый бит, равный 1. 
Если отделить знак от остальной части числа, оставшееся значение является неот- 
рицательным. Для любого значения, отличного от нуля (который рассматривается 
как особый случай), это число можно привести в диапазон от 1 (включительно) до 
менее 2 путем умножения на некоторую степень 2. 


Продолжая пример с гравитационной постоянной, поскольку знак равен +1, значе- 
ние после удаления знака остается неизменным: 6,674 х 10". Мантиссу этого чис- 
ла можно привести в диапазон (1 < 21 < 2), где т представляет собой мантиссу, ум- 
ноженную на 2*. Результат этого масштабирования: 


С =+1х1,1465845х2*. 


Для того чтобы мантисса попала в нужный диапазон, мы умножили исходное число 
на 2“, поэтому, чтобы компенсировать операцию масштабирования, представление 
числа с плавающей запятой необходимо умножить на 2—4. 


Так как наши компьютеры работают с двоичными числами, мы должны преобразо- 
вать мантиссу в двоичное представление. Формат, используемый при обработке с 
плавающей запятой, должен представлять число из диапазона от 1 до 2 в виде цело- 
го числа без знака. 


Например, если мы предположим, что двоичная мантисса имеет разрядность 16 бит, 
то мантисса 1,0 будет представлена числом @веен, а значение чуть меньше 2,0 (фак- 
тически, 1,99998474) — числом ЕЕЕЕН. Десятичная мантисса т преобразуется в дво- 
ичную 16-битную мантиссу с помощью выражения (т-1)х2!'° и округления 
результата до ближайшего целого числа. Двоичная 16-битная мантисса т преобра- 
зуется в десятичную с помощью выражения 1 + тх 2. 


В нашем примере десятичная мантисса 1,1465845 преобразуется в 16-битную дво- 
ичную мантиссу вида 00100101100001116 или 2587Н. 


С помощью процедуры масштабирования, описанной в этом разделе, числа с пла- 
вающей запятой можно представить в двоичной форме с любой желаемой разряд- 
ностью для мантиссы и порядка. 
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Для целей совместимости между процессорами полезно определить ограниченное 
число двоичных форматов с плавающей запятой, способных поддерживать широ- 
кий спектр вариантов применения, и принять эти форматы в масштабах всей 
отрасли. 


По этой причине в 1985 г. был принят стандарт ТЕЕЕ 754, определяющий компью- 
терное представление чисел с плавающей запятой. Прежде чем ознакомиться с ос- 
новными положениями этого стандарта, рассмотрим конструкцию сопроцессора 
пе! 8087, предназначенного для вычислений с плавающей запятой, который послу- 
жил источником многих концепций, позднее закрепленных в стандарте Г[ЕЁЕЁ 7534. 


Сопроцессор 8087 
для вычислений с плавающей запятой 


Современные процессоры с аппаратной поддержкой вычислений с плавающей за- 
пятой обычно реализуют набор соответствующих инструкций и выполняют эти 
операции в выделенном функциональном блоке. В суперскалярном процессоре яд- 
ро главного процессора выполняет инструкции других категорий, а математиче- 
ский сопроцессор (Йоайпр рошё ип, ЕРО) параллельно выполняет вычисления с 
плавающей запятой. 


Вспомните главу [, там говорилось, что оригинальный 1ВМ РС 1981 г. содержал 
гнездо для сопроцессора 8087 с плавающей запятой. Аппаратные средства сопро- 
цессора 8087 выполняют вычисления с плавающей запятой со скоростью примерно 
в 100 раз выше, чем функционально эквивалентная ему программная реализация, 
работающая на главном процессоре. 


Поскольку установка 8087 была необязательной, большинство программ для ПК, 
которые хотели воспользоваться его возможностями, сначала проверяли наличие 
8087 и в случае его отсутствия возвращались к библиотеке гораздо более медлен- 
ного кода для вычислений с плавающей запятой. 


Сопроцессор 8087 поддерживает следующие типы данных для обработки чисел: 
е 16-битное целое число в дополнительном коде; 
® 32-битное целое число в дополнительном коде; 
» 64-битное целое число в дополнительном коде; 


» 18-значное упакованное двоично-десятичное число (Бпагу соде4 4есита], 
ВСО) со знаком; 

» 32-битное короткое действительное число со знаком, 24-битной мантиссой и 
8-битным порядком; 

» 64-битное длинное действительное число со знаком, 53-битной мантиссой и 
11-битным порядком; 

» 80-битное временное действительное число со знаком, 64-битной мантиссой 
и 15-битным порядком. 
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Данные каждого типа хранятся в памяти в виде последовательности байтов. Фор- 
маты, используемые для типов данных, представляющих действительные числа, 
показаны на рис. 9.3. 


Короткое действительное Знак Порядок Мантисса 


число (32 бита) 1 бит 8 бит 23 бита 
число (64 бита) 1 бит 11 бит 52 бита 
число (80 битов) 1 бит 15 бит 64 бита 


Рис. 9.3. Форматы данных с плавающей запятой в сопроцессоре 8087 


Форматы коротких и длинных действительных чисел используют подразумеваемый 
бит 1 в качестве старшего бита мантиссы и не включают этот бит в свои двоичные 
представления. В качестве особого случая ноль представляется в этих форматах 
путем установки нулевых значений для мантиссы и порядка. 


Формат временного действительного числа используется внутри сопроцессора 8087 
для хранения промежуточных результатов. Этот формат имеет увеличенную точ- 
ность по сравнению с форматом длинного действительного числа, чтобы свести к 
минимуму распространение ошибок округления по серии вычислений. 


Каждый формат действительных чисел можно представить в виде 
5/5Е- смещение 
(-07@ (т), 


где 5 — это бит знака, Е — порядок, а т — мантисса. Смещение равно 127 для 
формата коротких действительных чисел, 1023 для формата длинных действитель- 
ных чисел и 16 383 для формата временных действительных чисел. 


Вычитание смещения преобразует беззнаковое целое число, хранящееся в поле по- 
рядка, в знаковое значение. 


В нашем примере действительное число С с десятичной мантиссой 1,1465845 и 
двоичным масштабом 2 представлено в формате короткого действительного числа 
со знаковым битом, равным нулю, порядком (-34 + 127) = 50 и мантиссой 
(11465845 — 1) х 22? = 12С348В. Комбинируя все три компонента, получаем сле- 
дующее 32-битное представление значения: 


6,674 х 101: (бит знака = 0) х 2?! + смещенный порядок = 
= 5Оьх 22? + (мантисса = 12С348р). 


Итоговое 32-битное значение с плавающей запятой одинарной точности: 2Е92с3д8Н. 


Сопроцессор 8087 добавляет к набору инструкций 8086/8088 68 обозначений опко- 
дов для выполнения арифметических, тригонометрических, экспоненциальных и 
логарифмических функций. В программе для ПК, использующей сопроцессор 8087, 
код состоит из одного потока инструкций 8088 и 8087, извлекаемых обычным по- 
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следовательным способом процессором 8088. Сопроцессор 8087 пассивно контро- 
лирует шины адресов и данных по мере выполнения процессором инструкций и 
подключается только при появлении опкода 8087. Процессор 8088 рассматривает 
инструкции 8087 как инструкции без операции (или пор) и игнорирует их. 


Когда 8087 начинает выполнять инструкцию, он может взять под контроль шину 
хоста для передачи данных между своими внутренними регистрами и системной 
памятью с помощью циклов прямого доступа к памяти (ОМА). 8087 и 8088 не пе- 
редают данные между собой напрямую и могут обмениваться данными, только со- 
храняя их в памяти для использования другим процессором. 


Выполнение инструкций сопроцессора 8087 происходит независимо от 8088, что 
делает ПК, оснащенный 8087, по-настоящему параллельной системой обработки. 
В 8087 предусмотрен выходной сигнал вВу5у, позволяющий процессору 8088 опре- 
делить, обрабатывает ли 8087 в данный момент инструкцию. 


Когда процессору 8088 требуются результаты работы 8087, 8088 должен подождать 
отключения сигнала Ву5у, и в этот момент он получает доступ к ячейкам памяти, 
содержащим результат инструкции 8087. 


Стандарт вычислений 
с плавающей запятой 1ЕЕЁЕ 754 


Наиболее широко используемыми форматами представления чисел с плавающей 
запятой в современных компьютерных системах являются форматы, определенные 
в стандарте ТЕЕЕ 754. Институт инженеров по электротехнике и электронике 
(ш5наме ог еспса| апд Еесвопс Епгшеегз, ШЕЕЕ) публикует широкий спектр 
стандартов, связанных с электротехникой, электроникой и вычислительной техни- 
кой. Первоначальная версия стандарта [ЕЕЕ 754 была принята в 1985 г. и в значи- 
тельной степени основывалась на типах данных и математических операциях со- 
процессора ше 8087. 


8087 не полностью соответствовал первоначальной версии стандарта ТЕЕЁ 754, ко- 
торый был опубликован через несколько лет после появления 8087. Более поздние 
сопроцессоры ше! с плавающей запятой, начиная с 80387 в 1987 г., уже полностью 
соответствовали этому стандарту. В современных 32- и 64-разрядных процессорах 
блок вычислений с плавающей запятой, соответствующий стандарту ТЕЕЕ 754, 
обычно размещают на той же интегральной микросхеме, что и основной процессор. 


Стандарт ТЕЕЕ 754 был обновлен в 2008 г. и еще раз — в 2019 г. Текущая версия 
ГЕЕЕ 754-2019 содержит определения для форматов чисел с плавающей запятой 
разрядностью 16, 32, 64, 128 и 256 бит. Эта версия также содержит форматы деся- 
тичных чисел с плавающей запятой разрядностью 32, 64 и 128 бит. 32-битный и 
64-битный форматы с плавающей запятой для двоичных чисел обычно поддержи- 
ваются в языках программирования, включающих операции с плавающей запятой. 
Поддержка остальных типов данных ГЕЕЕ 754, как правило, имеет более ограни- 
ченное распространение и не является стандартной для разных процессоров, язы- 
ков программирования и операционных систем. 
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В следующем разделе представлены функции, реализованные во многих современ- 
ных процессорных архитектурах для управления энергопотреблением системы. 


Управление питанием 


Для пользователей мобильных устройств с питанием от аккумулятора, таких как 
смартфоны, планшеты и ноутбуки, возможность длительной работы без подзарядки 
является важной характеристикой. Разработчики мобильных устройств уделяют 
большое внимание тому, чтобы расход энергии аккумулятора был минимальным 
при любых условиях эксплуатации. 


Вот некоторые методы, используемые проектировщиками для снижения энергопо- 
требления. 


е Перевод неработающих подсистем в состояние низкого энергопотребления 
или их полное отключение, когда они не нужны. Применение этого метода 
может оказаться невозможным для периферийных устройств, которые долж- 
ны быть доступны для реагирования на входящие запросы, например от сете- 
вых интерфейсов. 


» Снижение напряжения питания интегральных схем и тактовых частот в пе- 
риоды, когда скорость выполнения не критична. 


» Когда это возможно, сохранение информации о состоянии системы и выклю- 
чение питания процессора. Пользователи мобильных компьютеров знакомы с 
двумя режимами снижения энергопотребления, когда система не использует- 
ся: режим ожидания и спящий режим. В режиме ожидания питание подается 
только на оперативную память системы, в то время как остальная часть сис- 
темы выключена. Режим ожидания обеспечивает очень быстрый запуск, ко- 
гда пользователь возобновляет работу с системой. За эту оперативность при- 
ходится платить: для поддержания оперативной памяти в рабочем состоянии 
требуется значительное количество энергии. 


В спящем режиме все данные о состоянии системы записываются на диск, 
и система полностью выключается. Спящий режим не требует практически 
никакого питания, хотя для возобновления работы обычно нужно немного 
больше времени, чем в режиме ожидания. 


» Если требуется периодическая обработка, например в приложениях реально- 
го времени, то при завершении каждого этапа обработки процессор перево- 
дится в состояние низкого энергопотребления. Процессор остается в этом со- 
стоянии до тех пор, пока прерывание по таймеру (или прерывание другого 
типа) не "разбудит" процессор для следующей итерации. Многие встраивае- 
мые процессоры поддерживают режим ожидания с низким энергопотребле- 
нием, в котором конвейер инструкций останавливается, но остается готовым 
мгновенно возобновить выполнение в ответ на прерывание. Некоторые реа- 
лизации ОСРВ поддерживают эту концепцию, переводя процессор в режим 
ожидания, когда все задачи блокируются в ожидании прерывания или друго- 
го события. 
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Смартфоны и другие устройства с питанием от аккумулятора широко используют 
эти методы для минимизации разряда аккумулятора, сохраняя готовность мгновен- 
но отреагировать на действия пользователя и на внешние воздействия, такие как 
входящие вызовы и уведомления из социальных сетей. 


Современные процессоры в высокопроизводительных компьютерах и мобильных 
устройствах обычно поддерживают возможность регулирования тактовой частоты 
процессора во время выполнения кода, а в некоторых случаях могут изменять на- 
пряжение питания процессора. Это сочетание методов управления питанием рас- 
сматривается в следующем разделе. 


Динамическое изменение напряжения и частоты 


Оптимизация тактовой частоты процессора и напряжения питания с целью свести 
энергопотребление к минимуму называется динамическим изменением напряже- 
ния и частоты (дупатис уоНаре Недиепсу зсаПпр, ОУЕЗ). В режиме РУЕЗ процес- 
сор регулярно оценивает требования своего текущего рабочего состояния к произ- 
водительности и регулирует тактовую частоту и напряжение питания, чтобы свести 
к минимуму использование заряда аккумулятора, продолжая при этом работать на 
приемлемом уровне. 


В КМОП-чипе, содержащем множество транзисторов, разумная оценка потребляе- 
мой мощности составляет: 


Р=У си У. 
= 


В этом выражении Р отражает общее энергопотребление чипа, который содержит 
№ МОП-транзисторов; С; — емкость, создаваемая {-м транзистором; у; — напряже- 
ние питания этого транзистора; /; — его рабочая частота. 


Рассматривая эту формулу, мы видим, что потребляемая мощность схемы пропор- 
циональна квадрату напряжения питания и прямо пропорциональна емкости и ра- 
бочей частоте. Поскольку емкость схемы играет значительную роль в энергопо- 
треблении, выгодно производить устройство с помощью процесса изготовления, 
который уменьшает размер вентилей схемы, тем самым сводя емкость к минимуму. 
Это одна из причин, по которой переход на технологический процесс производства 
интегральных схем, поддерживающий меньшие размеры элементов, приводит к 
созданию устройств с пониженным энергопотреблением. 


Режим ОУЕЗ пытается свести к минимуму общее энергопотребление, постоянно 
снижая напряжение питания и тактовую частоту процессора настолько, насколько 
это возможно. 


Снижение напряжения питания схемы может обеспечить значительное снижение 
энергопотребления. Однако любое снижение напряжения питания процессора 
должно быть тщательно согласовано с изменением тактовой частоты. При сниже- 
нии напряжения питания КМОП-транзисторы переключаются медленнее. Это обу- 
словлено тем, что емкость, создаваемая каждым транзистором, остается неизмен- 
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ной, но ее заряд и разряд выполняются медленнее, т. к. процесс заряда/разряда про- 
исходит при меньшем напряжении. Для того чтобы при снижении напряжения сис- 
темы схема работала правильно, необходимо одновременно снижать тактовую частоту. 


По аналогии с гидравлической системой из главы 2, эффект от снижения напряже- 
ния питания КМОП эквивалентен снижению давления воды, наполняющей воз- 
душный шарик, прикрепленный к стенке трубы: при снижении давления в системе 
шарик наполняется медленнее. 


Снижение напряжения питания процессора также снижает помехоустойчивость 
схемы. Когда это происходит, внешним помехам, таким как электрическое поле, 
возбуждаемое при запуске двигателя в бытовом приборе, становится легче нару- 
шить внутреннюю работу процессора. Любое снижение напряжения процессора 
необходимо тщательно контролировать для обеспечения его надежной работы. 


Снижение тактовой частоты процессора (в дополнение к любому замедлению так- 
товой частоты, требуемому из-за снижения напряжения питания) снижает энерго- 
потребление примерно пропорционально. Снижение рабочей частоты также может 
повысить надежность системы, поскольку для переключения каждого вентиля вы- 
деляется больше времени на распространение и достижение конечного состояния, 
прежде чем оно будет зафиксировано вентилями, которыми он управляет. 


Сложное мобильное устройство, такое как смартфон, часто нуждается в быстром 
переходе между состояниями с высоким и низким энергопотреблением под дейст- 
вием различных входных сигналов, включая действия пользователя, запускаемые 
по таймеру события и поступление информации по беспроводным соединениям. 
Для системы выгодно быстро переключаться между режимами высокого и низкого 
энергопотребления по мере изменения обстоятельств, однако также важно ограни- 
чить частоту, с которой происходят такие переходы, поскольку сам акт переключе- 
ния между этими режимами требует некоторого расхода энергии. 


Пользователи ожидают, что их компьютеры и другие сложные цифровые устройст- 
ва будут потреблять не больше энергии, чем необходимо, но они также рассчиты- 
вают на то, что эти системы будут безопасными. В следующем разделе представле- 
ны ключевые аспекты управления безопасностью системы. 


Управление безопасностью системы 


Мы видели, как разделение уровней привилегий между режимами ядра и пользова- 
теля поддерживает эффективное разделение приложений, запущенных одним поль- 
зователем, от приложений других пользователей и от системных процессов. Это 
обеспечивает безопасность на уровне выполняемых программ. 


В общем и целом это хорошо, но как быть с системами, которые должны оставаться 
безопасными даже тогда, когда к ним имеют неограниченный физический доступ 
обычные непроверенные пользователи? Для того чтобы предотвратить доступ любо- 
пытных пользователей или злоумышленников к защищенному коду, данным и аппа- 
ратным ресурсам, нужно реализовать дополнительные меры на аппаратном уровне. 
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Прежде чем перейти к подробному описанию средств защиты на аппаратном уров- 
не, полезно перечислить некоторые категории информации и других ресурсов, ко- 
торые необходимо защищать в цифровых системах. 


» Личная информация. Такая информация, как государственные идентифи- 
кационные номера, пароли для доступа к банковским счетам, списки кон- 
тактов, электронные письма и текстовые сообщения, должна быть защище- 
на даже в случае потери или кражи мобильного устройства, содержащего 
эту информацию. 


» Деловая информация. Торговые секреты, списки клиентов, описания экспе- 
риментальных продуктов и стратегические планы — вот некоторые катего- 
рии конфиденциальных бизнес-данных, которые могут иметь большую цен- 
ность в руках конкурентов или преступников. Предприятия также собирают 
большое количество личной информации о своих клиентах и обязаны прила- 
гать значительные усилия для обеспечения безопасности этой информации. 


» Государственная информация. Государственные организации хранят ог- 
ромное количество личной информации о своих гражданах и должны гаран- 
тировать, что она может быть использована только в разрешенных. целях. 
Правительства государств также накапливают огромные объемы информа- 
ции, связанной с национальной безопасностью, которая требует применения 
развернутых протоколов безопасности. 


Помимо очевидных мер физической безопасности, связанных с хранением конфи- 
денциальной информации в надежно защищенном помещении с контролем доступа 
и эффективной системой сигнализации, можно предпринять ряд мер для защиты 
системы от широкого спектра атак. 


Рассмотрим смартфон. Технически грамотный человек может разобрать корпус те- 
лефона и получить доступ к аппаратным средствам на уровне электронных схем. 


Если этот человек сможет контролировать внешние электрические сигналы процес- 
сора и его каналы связи с другими компонентами системы, какие виды информации 
он сможет собрать? Ответ зависит от типов и количества аппаратных средств защи- 
ты, реализованных в конструкции системы. 


Первым шагом в проектировании безопасной системы является предотвращение 
внесения уязвимостей во время разработки. При разработке системы, содержащей 
встраиваемый процессор, весьма полезно предусмотреть интерфейс аппаратного 
отладчика, который позволяет подключить ПК к устройству с помощью специаль- 
ного интерфейсного кабеля. Используя это соединение, разработчики могут пере- 
программировать флеш-память, устанавливать контрольные точки в коде, отобра- 
жать значения регистров и переменных, а также пошагово просматривать работу 
кода. Если в выпущенной версии проекта интерфейс для подключения отладчика 
остается на печатной плате, то пользователи могут подключить к системе собст- 
венный отладчик и работать с ним так же, как и разработчики. 


Это явно нежелательно для любой системы, предназначенной для безопасной рабо- 
ты. Поскольку возможность подключения отладчика остается весьма полезной да- 
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же после выпуска продукта, разработчики иногда пытаются оставить сигналы от- 
ладчика в схеме, но замаскировать их каким-либо образом, чтобы сделать их функ- 
ции менее очевидными. В определенной степени этот подход может быть эффек- 
тивным, однако упорные хакеры продемонстрировали способность обнаруживать 
наличие даже самых искусно замаскированных отладочных интерфейсов и исполь- 
зовать их для доступа к внутренним устройствам процессора. Наличие доступного 
интерфейса аппаратной отладки в выпущенном продукте является серьезной уяз- 
вимостью безопасности. 


Многие производители процессоров начали внедрять средства защиты, чтобы не 
позволить даже технически грамотным и целенаправленным злоумышленникам 
нарушить защиту системы. Для обеспечения эффективной защиты разработчики 
должны внедрять и в полной мере использовать эти возможности в конструкциях 
своих систем. Вот некоторые примеры технологий безопасности. 


® Защищенный паролем интерфейс аппаратного отладчика. Некоторые се- 
мейства процессоров поддерживают добавление пароля к стандартному ин- 
терфейсу аппаратной отладки. Прежде чем такой процессор включит функ- 
цию отладки, подключенная система обязана пройти процесс первоначальной 
аутентификации, в ходе которого она должна предоставить надежный пароль 
(например, 256-битное число). Это эффективный подход, который сохраняет 
возможность безопасного поиска и устранения проблем, возникающих после 
выпуска продукта. 


е Внутренний механизм шифрования с хранилищем ключей. Некоторые 
процессоры поддерживают возможность шифрования и дешифрования и 
хранят секретные ключи для использования во время работы. Эти ключи 
должны быть сохранены в процессоре во время изготовления системы и по- 
сле сохранения должны быть недоступны извне. 


Такое сочетание шифровального механизма и хранимых ключей обеспечива- 
ет безопасную связь с авторизованными внешними устройствами. Использо- 
вание высокоскоростного аппаратного шифрования и дешифрования позво- 
ляет обеспечить безопасную связь с требуемой скоростью между физически 
разделенными подсистемами, как, например, в автомобиле. 


е Защита памяти устройства. Многие семейства процессоров предоставляют 
несколько вариантов защиты областей памяти. Например, банк ПЗУ, содер- 
жащий код, можно заблокировать после программирования, чтобы гаранти- 
ровать невозможность его последующего перепрограммирования. Области 
кода также можно заблокировать для чтения в виде данных, но при этом дос- 
туп к ним для выполнения может быть сохранен. Процессоры, в которых от- 
сутствует полноценный блок управления памятью, часто оснащают подсис- 
темой, называемой блоком защиты памяти (тетогу рго\есйоп ипи, МРИ) и 
предназначенной для управления требованиями безопасности различных об- 
ластей памяти процессора. 
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Несколько возможностей, необходимых для обеспечения безопасной работы сис- 
темы, были объединены в устройстве под названием Тга$ед Р1аМогт Модше (дове- 
ренный платформенный. модуль), о котором пойдет речь в следующем разделе. 


Доверенный платформенный модуль 


Современные ПК содержат подсистему, называемую доверенным платформен- 
ным модулем (Тгазед Р]аМогт Модще, ТРМ), который реализует различные 
функции безопасности. ТРМ — это устойчивый к взлому процессор, разработан- 
ный специально для выполнения криптографических операций. В современном ПК 
он может представлять собой небольшой модуль, подсоединяемый к материнской 
плате, а иногда он реализован в виде отдельного функционального блока в инте- 
гральной схеме главного процессора. 


Общие категории функциональных возможностей ТРМ таковы. 


е Генерирование случайных чисел. Когда необходимо выбрать большое чис- 
ло, которое будет очень трудно угадать кому-то другому, лучше всего ис- 
пользовать для выбора этого числа действительно случайный метод. Боль- 
шинство языков программирования предоставляют механизм для 
генерирования последовательностей чисел, выглядящих как случайные, но в 
большинстве случаев эти последовательности хотя бы в некоторой степени 
предсказуемы после получения серии выборок. ТРМ предоставляет функцию 
генерирования истинных случайных чисел, которая подходит для формиро- 
вания криптографических ключей, способных обеспечить надежную защиту 
данных. Генератор истинных случайных чисел использует специализирован- 
ные аппаратные средства для генерирования непредсказуемой последова- 
тельности битов 0 и |. 


» Генерирование криптографических ключей. Модуль ТРМ может созда- 
вать криптографические ключи стандартных форматов для использования 
внутри системы и по запросу пользовательских приложений. Эти ключи 
обычно применяются для таких целей, как цифровая подпись электронной 
почты и защита доступа к веб-приложениям. 


» Хранение криптографических ключей. Помимо генерирования криптогра- 
фических ключей, ТРМ может надежно хранить несколько ключей для раз- 
личных целей. Шифрование с открытым ключом использует попарно сге- 
нерированные ключи. Одним из ключей пары является открытый ключ, 
которым можно свободно делиться с кем угодно. Другой ключ, называемый 
секретным ключом, должен быть защищен и предназначен для использова- 
ния только владельцем ключа. Данные, зашифрованные с помощью открыто- 
го ключа, могут быть расшифрованы лишь с помощью секретного ключа. 
И, аналогично, данные, зашифрованные с помощью секретного ключа, могут 
быть расшифрованы только с помощью соответствующего открытого ключа. 
Шифрование с открытым ключом реализует многие возможности обеспече- 
ния безопасности, такие как шифрование электронной почты и цифровые 
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подписи документов. Модуль ТРМ можно настроить на постоянную блоки- 
ровку хранимого в нем секретного ключа, что гарантирует невозможность 
его обнаружения вредоносным программным обеспечением или даже про- 
двинутым злоумышленником, получившим полный физический доступ к 
системе. 


е Проверка целостности системы. ТРМ принимает непосредственное участие 
в процессе безопасной загрузки. Этот процесс гарантирует, что в ходе загруз- 
ки разрешено выполнение только доверенных компонентов встроенного и 
прочего программного обеспечения. Процесс безопасной загрузки включает в 
себя вычисление и проверку цифровой подписи каждого используемого во 
время загрузки компонента встроенного и прочего программного обеспече- 
ния до его выполнения. 


» Мониторинг работоспособности системы. Модуль ТРМ может гарантировать, 
что функции безопасности системы, такие как шифрование дисков и безопас- 
ная загрузка, будут непрерывно действовать во время работы системы. 


» Услуги аутентификации. Модуль ТРМ предоставляет программный интер- 
фейс, предлагающий криптографические функции по мере необходимости 
для использования приложениями непривилегированного уровня. Этот ин- 
терфейс представляет собой безопасный механизм привязки идентификаци- 
онных данных пользователя к цифровому устройству. Секретный ключ, со- 
держащийся в ТРМ, обеспечивает надежную, исключающую возможность 
подделки идентификацию пользователя. 


Благодаря ТРМ современные ПК и другие цифровые устройства можно безопасно 
использовать в финансовых и конфиденциальных транзакциях по незащищенным 
каналам связи, включая Интернет. 


Главная цель таких механизмов безопасности, как ТРМ, — пресечь попытки кибе- 
ратак, целью которых является кража информации или финансовых активов, при- 
надлежащих пользователям компьютерных систем. Спектр возможных атак и неко- 
торые способы защиты от них обсуждаются в следующем разделе. 


Противодействие кибератакам 


Недостаточно спроектировать компьютерную систему со стандартным набором 
средств защиты и полагать, что хакеры не смогут преодолеть эти средства защиты. 
Злоумышленники демонстрируют необычайную сообразительность и используют 
любые доступные способы, чтобы проникнуть во внутренние механизмы системы, 
которая кажется им интересной, будь то из интеллектуального любопытства или из 
преступных побуждений. 


Вот некоторые области, которые следует рассмотреть помимо стандартных мето- 
дов обеспечения безопасности. 


е Анализ энергопотребления, временных зависимостей и излучений. Ис- 
пользуя детальный мониторинг энергопотребления системы, времени актив- 
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ности внешних сигналов или даже радиочастотных излучений, генерируемых 
во время выполнения алгоритмов, можно провести обратную разработку дей- 
ствий, происходящих внутри процессора. Известны случаи успешных атак, 
основанных на этих методах, например для извлечения секретных ключей 
шифрования во время выполнения криптографического алгоритма. 


» Нарушение энергоснабжения. Атаки, вызывающие колебания или падения 
напряжения питания во время включения или работы системы, как было по- 
казано на практике, приводят к тому, что многие системы оказываются в уяз- 
вимом состоянии, в котором некоторые средства защиты становятся неэф- 
фективными. Надежная система должна предвидеть такое поведение, 
естественное или преднамеренное, и возвращаться в безопасное и надежное 
состояние всякий раз, когда источник питания работает вне пределов уста- 
новленных параметров. 


е Физическое вмешательство. Злоумышленник может заменить некоторые 
компоненты в системе, пытаясь получить повышенный уровень контроля или 
доступ к важным функциям или данным. Например, замена загрузочного 
ПЗУ в мобильном устройстве может обеспечить нормальную работу системы 
и одновременно предоставить злоумышленнику возможность получить неог- 
раниченный доступ к системе, используя код в замененном ПЗУ. Все боль- 
шее число семейств процессоров поддерживают использование цифровых 
подписей для проверки подлинности кода ПЗУ. Для проверки содержимого 
ПЗУ во время запуска процессор выполняет криптографический алгоритм 
хеширования над содержимым ПЗУ. Прежде чем будет разрешено выполне- 
ние хранящегося в ПЗУ кода, результаты вычисления хеш-функции (сигнату- 
ра) должны совпасть с сигнатурой, предварительно загруженной во внутрен- 
нюю память процессора. Алгоритм хеширования разработан таким образом, 
чтобы сделать практически невозможным изменение хранящихся в ПЗУ дан- 
ных и при этом предоставить ожидаемую сигнатуру. Для дополнительной 
безопасности содержимое ПЗУ также может быть зашифровано, что не по- 
зволит злоумышленнику проанализировать содержащийся в нем код. 


В этом разделе были описаны современные подходы, которые широко используют- 
ся для реализации мер безопасности в цифровых устройствах, и рассмотрены неко- 
торые из более редких уязвимостей, которыми пользуются целеустремленные зло- 
умышленники. Проектирование безопасной системы должно начинаться с твердого 
усвоения основных элементов безопасности, но также требует большой изобрета- 
тельности при рассмотрении множества способов, которыми решительно настроен- 
ный злоумышленник может попытаться прорвать ее защиту. 


Резюме 


В этой главе на основании изложенного в предыдущих главах были представлены 
особенности компьютерной архитектуры, реализующие функциональные требова- 
ния, характерные для конкретных областей. Мы сосредоточились на расширениях, 
обычно реализуемых на уровне набора инструкций процессора и во внешних по 
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отношению к процессору компонентах, которые предоставляют дополнительные 
возможности помимо общих требований к вычислениям. 


Теперь вы должны хорошо ориентироваться в привилегированных режимах про- 
цессора и их использовании в многопроцессорных и многопользовательских кон- 
текстах, концепциях процессоров и наборов инструкций для вычислений с пла- 
вающей запятой, методах управления питанием в устройствах с аккумуляторным 
питанием, а также в особенностях процессоров и систем, предназначенных для по- 
вышения уровня их защиты. 


Эти знания подготовили нас к следующей главе, в которой мы рассмотрим наибо- 
лее популярные архитектуры процессоров и наборы инструкций, используемые в 
настоящее время в персональных компьютерах, компьютерах бизнес-класса и ин- 
теллектуальных мобильных устройствах. Будут рассмотрены следующие архитек- 
туры: х86, х64, а также 32- и 64-разрядные варианты АВЕМ. 


Упражнения 


1. Используя язык программирования, который предоставляет доступ к байтовому 
представлению типов данных с плавающей запятой (например, С или С++), на- 
пишите функцию, которая принимает в качестве входных данных 32-битное 
значение одинарной точности. Извлеките знак, порядок и мантиссу из байтов 
этого значения с плавающей запятой и выведите их на устройство отображения. 
Удалите смещение из порядка перед выводом его значения и выведите мантис- 
су в виде десятичного числа. Протестируйте программу на значениях @, -6, 1, -1, 
6.674е-11, 1.0е38, 1.0е39, 1.0е-38 и 1.@е-39. Перечисленные здесь числовые значе- 
ния, содержащие е, используют текстовое представление чисел с плавающей 
запятой на языке С/С++. Например, 6.674е-11 означает 6,674 х 10". 


2. Измените программу из упражнения 1, чтобы она могла также принимать зна- 
чение с плавающей запятой двойной точности и выводить знак, порядок (с уда- 
ленным смещением) и мантиссу этого значения. Протестируйте ее с теми же 
входными значениями, что и в упражнении [, а также со значениями 1.0е368, 
1.0е309, 1.0е-308 и 1.0е-309. 


3. Найдите в Интернете информацию о семействе процессоров 1.МХ ВТ1060 ком- 
пании МХР Зеписопдисюг$. Скачайте технические описания этого семейства и 
ответьте на следующие вопросы об этих процессорах. 


4. Поддерживают ли процессоры 1.МХ КТ1060 концепцию выполнения инструк- 
ций в режиме супервизора? Объясните свой ответ. 


5. Поддерживают ли процессоры 1.МХ КТ1060 концепцию виртуальной памяти со 
страничной организацией? Объясните свой ответ. 


6. Поддерживают ли процессоры 1.МХ ВТ1060 аппаратные вычисления с пла- 
вающей запятой? Объясните свой ответ. 


Какие функции управления питанием поддерживают процессоры 1.МХ КТ1060? 


Какие функции безопасности поддерживают процессоры 1.МХ ВТ1060? 


10 


Современные архитектуры 
и наборы инструкций процессоров 


Большинство современных персональных компьютеров содержат процессор, под- 
держивающий 32-разрядную архитектуру х86 или 64-разрядную архитектуру х64 от 
ше! или АМБ. С другой стороны, почти все смартфоны, умные часы, планшеты и 
многие встраиваемые системы содержат 32- или 64-разрядные процессоры АКМ. 
В этой главе подробно рассматриваются регистры и наборы инструкций процессо- 
ров этих семейств. 


Прочитав эту главу, вы получите представление о высокоуровневой организации и 
уникальных атрибутах регистров, наборов инструкций и языков ассемблера архи- 
тектур х86, хб4, 32- и 64-разрядных архитектур АКМ, а также о важных аспектах 
унаследованных функций, поддерживаемых в этих архитектурах. 


В этой главе рассматриваются следующие темы: 
» архитектура и набор инструкций х86; 
» архитектура и набор инструкций х64; 
» архитектура и набор инструкций 32-разрядных процессоров АВМ; 


® архитектура и набор инструкций 64-разрядных процессоров АКМ. 


Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 
В рб: //рВиБ.сот/Раск Ри $ п т?/Модегп-Сотрщег-Агси Нес иге-ап9д- 
ОграптаНоп-Зесопд-ЕЧ1оп. 
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Архитектура и набор инструкций х86 


Для целей настоящего обсуждения термин "х86" относится к 16-разрядной и 
32-разрядной версиям архитектуры набора инструкций для серии процессоров, ко- 
торая началась с п 8086, представленного в 1978 г. Процессор 8088, выпущен- 
ный в 1979 г., функционально очень похож на 8086, за исключением того, что он 
оснащен 8-разрядной шиной данных вместо 16-разрядной шины в 8086. 8088 был 
центральным процессором оригинального персонального компьютера 1ВМ РС. 


Последующие поколения процессоров этой серии получили названия 80186, 80286, 
80386 и 80486, что привело к появлению термина "х86" в качестве сокращения для 
всех членов этого семейства. В дальнейшем было принято решение об отказе от 
соглашения о цифровых наименованиях, и для следующих поколений использова- 
лись названия Репиит, Соге, 1 Зепез, Сёегоп и Хеоп. 


Адуапседа М!сго Беусе$ (АМО), компания по производству полупроводников, 
конкурирующая с п], производит х86-совместимые процессоры с 1982 г. Некото- 
рые из недавних поколений процессоров АМО х86 получили названия Кутеп, 
Орегоп, А оп, Типоп, РВепот и Зетргоп. 


Совместимость в отношении выполнения кода между процессорами Пе и АМРО 
хороша во многих аспектах. Между процессорами этих двух производителей есть 
некоторые существенные различия, в том числе конфигурация выводов чипов и 
совместимость с набором микросхем. 


Процессоры Шш|, как правило, работают только на материнских платах и с набора- 
ми микросхем, предназначенными для чипов |, а процессоры АМР — только на 
материнских платах и с наборами микросхем, предназначенными для чипов АМО. 
Позже в этом разделе мы рассмотрим некоторые другие различия между процессо- 
рами ше! и АМО. 


8086 и 8088 — это 16-разрядные процессоры, несмотря на 8-разрядную шину дан- 
ных в 8088. Внутренние регистры в этих процессорах имеют разрядность 16 бит, 
а набор инструкций работает с 16-битными значениями данных. Процессор 8088 
явным образом выполняет два цикла шины для передачи каждого 16-битного зна- 
чения между процессором и памятью. 


8086 и 8088 не поддерживают более сложные функции современных процессоров, 
такие как виртуальная память со страничной организацией и кольца защиты. Эти 
ранние процессоры также имели всего 20 адресных строк, что ограничивало объем 
адресуемой памяти одним мегабайтом. 20-разрядный адрес не может поместиться в 
16-разрядный регистр, поэтому для доступа к полному адресному пространству 
объемом 1 Мбайт необходимо использовать некоторым образом усложненную сис- 
тему сегментных регистров и смещений. 


В 1985 г. компания | выпустила процессор 80386 с улучшениями, которые сня- 
ли многие из этих ограничений. 
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В нем были введены следующие возможности. 


»е 32-разрядная архитектура. Адреса, регистры и АЛУ имеют разрядность 
32 бита, а инструкции изначально работают с операндами разрядностью до 
32 бит. 


е Защищенный режим. Этот режим реализует многоуровневый механизм 
привилегий, состоящий из колец с номерами от 0 до 3, которые мы рассмот- 
рели в главе 9. В \У/т4о\$ и Гапих кольцо 0 — это режим ядра, а кольцо 3 — 
пользовательский режим. Кольца | и 2 не используются в этих операционных 
системах. 


» Блок управления памятью (ММО) на чипе. В процессоре 80386 блок ММО 
поддерживает плоскую модель памяти, позволяющую с помощью 32-разряд- 
ного адреса получить доступ к любой ячейке в пространстве объемом 
4 Гбайт. Манипулирование сегментными регистрами и смещениями больше 
не требуется. ММУ поддерживает виртуальную память со страничной орга- 
низацией. 


» Трехступенчатый конвейер инструкций. Этот конвейер ускоряет выполне- 
ние инструкций, как описано в главе 8. 


» Регистры аппаратной отладки. Регистры отладки поддерживают настройку 
до четырех контрольных точек, которые останавливают выполнение кода по 
указанному виртуальному адресу при обращении к этому адресу и выполне- 
нии выбранного условия. Доступные условия остановки — выполнение кода, 
запись данных и чтение или запись данных. Эти регистры доступны только 
для использования кодом, запущенным в кольце 0. 


Современные процессоры семейства х86 при загрузке переводятся в 16-разрядный 
режим работы оригинального 8086, который теперь называется реальным режи- 
мом. Он сохраняет совместимость с программным обеспечением, написанным для 
среды 8086/8088, таким как операционная система М$-РО$З. 


В большинстве современных систем, работающих на процессорах семейства х86, 
переход в защищенный режим происходит во время запуска системы. После этого 
перехода операционная система остается в данном режиме до тех пор, пока компь- 
ютер не будет выключен. 


М5-0О5 НА СОВРЕМЕННОМ ПК 


Процессор семейства х86 в современном ПК совместим на уровне ин- 
струкций с оригинальным процессором 8088, однако запуск старой 
копии М$-ОО$ в современной компьютерной системе вряд ли будет 

2 простой процедурой. Периферийные устройства и их интерфейсы в 
современных ПК не совместимы с соответствующими интерфейсами в 
ПК 1980-х годов. М$-ОО$ потребуется драйвер, который понимает, как 
взаимодействовать, например, с подключенной через интерфейс Ч$В 
клавиатурой современной материнской платы. 
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В наши дни 16-разрядный режим в процессорах х86 в основном используется в ка- 
честве загрузчика для операционной системы, работающей в защищенном режиме. 
Поскольку большинство разработчиков компьютерных устройств и программного 
обеспечения, которое работает на них, вряд ли будут привлечены к реализации та- 
кой возможности, оставшаяся часть нашего обсуждения архитектуры х86 в этой 
главе будет посвящена защищенному режиму и связанной с ним плоской модели 
32-разрядной памяти. 


Архитектура х86 поддерживает беззнаковые и знаковые целочисленные типы дан- 
ных в дополнительном коде разрядностью 8, 16, 32, 64 и 128 бит. Этим типам дан- 
ных присвоены следующие названия: 


» ру (байт) — 8 бит; 

е \ога (слово) — 16 битов; 

» допе\мога (двойное слово) — 32 бита; 

» аиафууог@ (учетверенное слово) — 64 бита; 

» 4оцЫе диадуог (двойное учетверенное слово) — 128 бит. 


В большинстве случаев архитектура х86 не предписывает хранение данных этих 
типов в естественных границах. Естественная граница типа данных — это любой 
адрес, делящийся на размер типа данных в байтах без остатка. 


Хранение любого из многобайтовых типов в невыровненных границах разрешено, 
но не рекомендуется, поскольку это негативно сказывается на производительности: 
для выполнения инструкций, работающих с невыровненными данными, требуются 
дополнительные такты. Несколько инструкций, которые работают с двойными 
учетверенными словами, требуют хранилища с естественным выравниванием и при 
попытке доступа к невыровненным данным генерируют ошибку общей защиты. 


Архитектура х86 имеет встроенную поддержку типов данных с плавающей запятой 
разрядностью 16, 32, 64 и 80 битов. 32-битный, 64-битный и 80-битный форматы 
были представлены в главе 9. 16-битный формат с плавающей запятой называют 
форматом половинной точности, он имеет 11-битную мантиссу, подразумеваемый 
ведущий бит | и 5-битный порядок. Формат с плавающей запятой половинной точ- 
ности широко используется в обработке данных графическим процессором. 


В следующем разделе мы подробно рассмотрим набор регистров архитектуры х86. 


Набор регистров архитектуры х86 


В защищенном режиме архитектуры х86 предусмотрены восемь 32-разрядных ре- 
гистров общего назначения, регистр флагов и указатель инструкций. Также преду- 
смотрены шесть сегментных регистров и дополнительные регистры конфигурации, 
зависящие от конкретной модели процессора. Сегментные регистры и регистры, 
относящиеся к конкретной модели процессора, настраиваются системным про- 
граммным обеспечением во время запуска и, как правило, не представляют никако- 
го интереса для разработчиков приложений и драйверов устройств. По этим причи- 
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нам мы не будем далее обсуждать сегментные регистры и регистры для конкретных 
моделей процессоров. 


16-разрядные регистры общего назначения в оригинальной архитектуре 8086 назы- 
ваются АХ, СХ, ОХ, ВХ, $Р, ВР, $Т и ОТ. Причина перечисления первых четырех регистров 
в порядке, не соответствующем алфавитному, заключается в том, что эти восемь 
регистров помещаются в стек с помощью инструкции ризНад (поместить все регист- 
ры) именно в таком порядке. 


При переходе на 32-разрядную архитектуру процессора 80386 разрядность каждого 
регистра увеличилась до 32 бит. 32-разрядная версия имени регистра имеет пре- 
фикс с буквой Е для обозначения этого расширения. 


Возможен доступ к частям 32-разрядных регистров с меньшей битовой шириной. 
Например, к младшим 16 битам 32-разрядного регистра ЕАХ можно обращаться по 
имени АХ. Регистр АХ, в свою очередь, может быть доступен в виде отдельных бай- 
тов, используя имена АН (старший байт) и АЕ (младший байт). На рис. 10.1 показаны 
имена регистров и подмножества каждого из них. 


ЕЗР 
5Р 


32 бита 
16 бит 
8 бит 


32 бита 
16 бит 
8 бит 


5 


гп 


Рис. 10.1. Имена и подмножества регистров 


Запись в часть 32-разрядного регистра, например в АЁ, затрагивает только биты в 
этой части. Загрузка 8-битного значения в АЁ изменяет младшие 8 бит регистра ЕАХ, 
оставляя остальные 24 бита без изменений. 


В порядке соблюдения традиции архитектуры С15С семейства х86 несколько функ- 
ций, связанных с различными инструкциями, привязаны к определенным регист- 
рам. В табл. 10.1 приведено описание функций, связанных с каждым регистром 
общего назначения х86. 
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Таблица 10.1. Регистры общего назначения х86 и связанные с ними функции 


Аккумулятор Арифметические операции 
Счетчик циклов и счетчик сдвига/вращения 


Арифметические операции и операции 
ввода-вывода 


Указатель стека Указатель на вершину стека 
Указатель на базу стека внутри функции 


Указатель на исходное местоположение 
в операциях с массивами 


Указатель на конечное местоположение 
в операциях с массивами 


Эти привязанные к регистрам функции контрастируют с архитектурами многих 
процессоров В]$С, которые, как правило, предлагают большее количество регист- 
ров общего назначения. Регистры в ЕГЗС-процессоре по большей части функцио- 
нально эквивалентны друг другу. 


Регистр флагов х86, ЕРЬАб$, содержит биты состояния процессора, описанные в 
табл. 10.2. 


Таблица 10.2. Биты регистра флагов х86 


Флаг переноса: указывает, привело ли сложение к переносу или вы- 
читание к заимствованию. Используется в качестве входных данных 
инструкциями сложения и вычитания 


Флаг четности: устанавливается, если младшие 8 бит результата со- 
держат четное число битов со значением 1 


Флаг вспомогательного переноса: указывает, привело ли сложение к 
переносу или вычитание к заимствованию из 4 младших битов. Ис- 
пользуется в двоично-десятичной арифметике 


ЕЕ Флаг нуля: устанавливается, если результат операции равен нулю 
мы Флаг знака: устанавливается, если результат операции отрицателен 
ЕЕ м 2: Флаг трассировки: используется при пошаговой отладке 


Флаг разрешения прерываний: установка этого бита разрешает вы- 
полнение аппаратных прерываний 
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Таблица 10.2 (окончание) 


| Бит. Название |Функция 
10 Флаг направления: управляет направлением обработки строк. Если 
равен 0, используется порядок от низшего адреса к высшему. Если 
равен 1, используется порядок от самого высшего адреса к низшему 
11 ОЕ Флаг переполнения: устанавливается, если операция привела к пере- 
полнению со знаком 


12-13 ТОРЕ Уровень привилегий ввода-вывода: уровень привилегий выполняе- 
мого в данный момент потока. Если ОРГ, имеет значение 0 — это 


режим ядра, если равен 3 — пользовательский режим 


а Флаг вложенной задачи: управляет цепочкой прерываний 


Флаг возобновления: используется для обработки исключений во 
время отладки 


Флаг виртуального режима 8086: если установлен, включен режим 
совместимости с процессором 8086. Этот режим позволяет запускать 
некоторые приложения М$-ОО$ в контексте операционной системы 
с защищенным режимом 


Флаг контроля выравнивания: если установлен, включена функция 
контроля выравнивания данных в памяти. Например, если флаг АС 
установлен, сохранение 16-битного значения по нечетному адресу 
вызывает исключение контроля выравнивания. Когда этот флаг не 
установлен, процессоры х86 могут выполнять доступ к памяти без 
выравнивания, но количество тактов, требуемых для выполнения 
инструкций, при этом может увеличиться 


Флаг разрешения виртуальных прерываний: виртуальная версия фла- 
га ТЕ в виртуальном режиме 8086 


Флаг ожидающего виртуального прерывания: устанавливается, когда 
прерывание находится в состоянии ожидания в виртуальном режиме 
8086 


Флаг идентификации: если этот бит может быть установлен, поддер- 
живается инструкция сри19. Инструкция сри19 возвращает идентифи- 
катор процессора и информацию о функциях 


Все биты в регистре ЕЕЬАб$, которые отсутствуют в табл. 10.2, зарезервированы и не 
используются. 


32-битный указатель инструкций ЕТР содержит адрес следующей инструкции для 
выполнения, если не было выбрано ответвление. Когда выполняется условие от- 
ветвления, в ЕТР загружается адрес назначения ветви и выполнение продолжается с 
этого адреса. 
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В архитектуре х86 принят прямой порядок байтов. это означает, что многобайтовые 
значения хранятся в памяти с наименьшим значащим байтом по низшему адресу и 
наиболее значимым байтом по высшему адресу. 


Режимы адресации х8 6 


Как и следовало ожидать от архитектуры С1$С, х86 поддерживает несколько режи- 
мов адресации. Существует несколько правил, связанных с адресацией операндов- 
источников и операндов-приемников, которым необходимо следовать для получе- 
ния правильных инструкций. Например, размеры операнда-источника и операнда- 
приемника в инструкции тоу должны быть равны. Ассемблер попытается выбрать 
подходящий размер для операнда, который имеет неопределенный размер (напри- 
мер, непосредственное значение 7), чтобы он соответствовал разрядности целевого 
местоположения (например, 32-битного регистра ЕАХ). В случаях, когда размер опе- 
ранда не может быть определен, для указания размера необходимо использовать 
ключевые слова, такие как Букеркг. 


Язык ассемблера в этих примерах использует синтаксис Гие[, в котором принято 
размещение операндов в порядке "приемник — источник". Синтаксис Пе] исполь- 
зуется в основном в контекстах \Мт4до\$ и М$-ОО$. В альтернативной нотации, 
известной как синтаксис АТ&Т, операнды размещаются в порядке "источник — 
приемник". Этот синтаксис используется в операционных системах на основе 
МХ. Во всех примерах в этой книге используется синтаксис ш@|. 


Архитектура х86 поддерживает несколько режимов адресации, которые мы рас- 
смотрим далее. Комментарии в коде ассемблера начинаются с точки с запятой и 
продолжаются до конца строки. 


Неявная адресация 


В этом режиме адресации регистр определяется опкодом инструкции. Пример: 


с1с ; обнуление флага переноса (СЕ 6 регистре флагов ЕЕШАб$) 


Регистровая адресация 


Один или оба регистра, источник и приемник, закодированы в инструкции: 


поу еах, есх ; копирование содержимого регистра ЕСХ 6 регистр ЕАХ 


Регистры можно использовать в качестве первого операнда, второго операнда или 
обоих операндов. 


Непосредственная адресация 


В качестве операнда инструкции подставляется непосредственное значение: 


тоу еах, 7 ; перемещение 32-битного значения 7 В регистр ЕАХ 
поу ах, 7 ; перемещение 16-битного значения 7 6 регистр АХ 
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При использовании синтаксиса ш!| не требуется ставить перед непосредственны- 
ми значениями символ $#. 

Адресация с прямым доступом к памяти 

В качестве операнда инструкции подставляется адрес значения: 


тоу еах, [9786сН] ; копирование 32-битного значения по шестнадцатеричному адресу 
; 78ВС В регистр ЕАХ 


В ассемблере х86 заключение выражения в квадратные скобки означает, что выра- 
жение является адресом. При выполнении перемещений или других операций над 
операндами, заключенными в квадратные скобки, значение, над которым произво- 
дится операция, — это данные по указанному адресу. Исключением из этого пра- 
вила является инструкция |ЕА (загрузка действительного адреса), которую мы рас- 
смотрим позже. 


Косвенная регистровая адресация 


Операндом является регистр, содержащий адрес значения данных: 


тоу еах, [е$1] ; копирование 32-битного значения по адресу, указанному 
; 6 регистре Е$Т, 6 регистр ЕАХ 


Этот режим эквивалентен использованию указателя для ссылки на переменную в С 
или С++. 
Индексная адресация 


Операнд указывает регистр и смещение, сочетание которых определяет адрес зна- 
чения данных: 


тому еах, [е51 + 9] ; копирование 32-битного значения по адресу (Е$Т + @Ьп) 
; 6 регистр ЕАХ 


Этот режим удобен для доступа к элементам структуры данных. В этом сценарии 
регистр Е5т содержит адрес структуры, а добавленная константа — байтовое сме- 
щение элемента от начала этой структуры. 


Относительная индексная адресация 


Операнд указывает базовый регистр, индексный регистр и смещение, которые сум- 
мируются для определения адреса значения данных: 


поу еах, [еБх + е$1 + 109] ; копирование 32-битного значения с началом 
; по адресу (ЕВХ + ЕЗТ + 10) 6 регистр ЕАХ 
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Режим удобен для доступа к отдельным элементам данных в массиве структур дан- 
ных. В этом примере регистр ЕВХ содержит адрес начала массива структур, регистр 
ЕЗТ содержит смещение нужной структуры в массиве, а постоянное значение (10) 
представляет собой смещение нужного элемента данных от начала выбранной 


структуры. 


Относительная индексная адресация 
с масштабированием 


Операнд состоит из базового регистра, индексного регистра, умноженного на мас- 
штабный коэффициент, и смещения, которые суммируются для определения адреса 
значения данных: 


тоу еах, [ебх + е$1*4 + 10] ; копирование 32-битного значения с началом 
; по адресу (ЕВХ + ЕЗТ*4 + 10) 6 регистр ЕАХ 


В этом режиме адресации перед суммированием с другими компонентами адреса 
операнда значение в индексном регистре может быть умножено на 1 (по умолча- 
нию), 2, 4 или 8. Использование масштабного коэффициента не приводит к сниже- 
нию производительности. Эта возможность удобна при итерации по массивам, со- 
держащим элементы размером 2, 4 или 8 байт. 


В режимах относительной адресации в качестве базового или индексного регистра 
можно использовать большинство регистров общего назначения. 


На рис. 10.2 показаны возможные комбинации использования регистров и масшта- 
бирования в режимах относительной адресации. 


База Индекс Масштаб Смещение 
Нет 


8 бит 


16 бит 


32 бита 


Рис. 10.2. Режим относительной адресации 


Все восемь регистров общего назначения можно использовать в качестве базового 
регистра. И из этих восьми только Е$Р нельзя применять в качестве индексного ре- 
гистра. 


Современные архитектуры и наборы инструкций процессоров 295 


Категории инструкций х86 


Набор инструкций х86 был представлен вместе с процессором Г! 8086 и за про- 
шедшие годы несколько раз расширялся. Некоторые из наиболее значительных из- 
менений связаны с расширением архитектуры с 16 до 32 бит, при котором также 
были добавлены защищенный режим и виртуальная память со страничной органи- 
зацией. Почти во всех случаях новые возможности добавлялись с сохранением 
полной обратной совместимости. 


Полный набор инструкций х86 содержит несколько сотен инструкций. Мы не бу- 
дем обсуждать их все в этой главе. В этом разделе приведены краткие обзоры наи- 
более важных и часто встречающихся инструкций, применимых к приложениям, 
работающим в пользовательском режиме, и драйверам устройств. 


Это подмножество инструкций х86 можно разделить на несколько общих катего- 
рий: перемещение данных, манипулирование стеком, арифметика и логика, преоб- 
разования, поток управления, манипулирование строками и флагами, ввод-вывод, 
защищенный режим. Мы также рассмотрим несколько вспомогательных инструк- 
ций, которые не относятся к какой-либо определенной категории. 


Перемещение данных 


Инструкции перемещения данных не влияют на флаги процессора. Перемещение 
данных выполняют следующие инструкции. 


® оу — копирование значения данных, на которое указывает второй операнд, 
в ячейку памяти, указанную в качестве первого операнда. 


» стоусс — условное перемещение данных второго операнда в регистр, указан- 
ный в качестве первого операнда, если условие сс истинно. Условие опреде- 
ляется по одному или нескольким из следующих флагов процессора: СЕ, 2Е, 
$Е, ОЕ и РЕ. Используются следующие коды условий: е (равно), пе (не равно), 
Е (больше), ве (больше или равно), а (выше), ае (выше или равно), 1 (меньше), 
1е (меньше или равно), 6 (ниже), Бе (ниже или равно), о (переполнение), 
по (без переполнения), 2 (ноль), п2 (не ноль), $ ($Е = 1), пз ($Е = 0), схг (регистр сх 
содержит ноль) и есхг (регистр ЕСХ содержит ноль). 


® тоу5х, поугх — это варианты инструкции птоу, выполняющие расширение знака 
и дополнение нулями, соответственно. Операнд-источник должен быть 
меньшего размера, чем операнд-приемник. 


® 1еа— вычисление адреса, предоставляемого вторым операндом, и сохране- 
ние его в ячейку памяти, указанную в первом операнде. Второй операнд за- 
ключен в квадратные скобки. В отличие от других инструкций перемещения 
данных, по адресу назначения хранится вычисленный адрес, а не значение 
данных. 
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Манипулирование стеком 


Инструкции манипулирования стеком не влияют на флаги процессора. К этой кате- 
гории относятся следующие инструкции: 


ризп — уменьшение содержимого регистра ЕБР на 4, а затем помещение 32-бит- 
ного операнда в ячейку стека, на которую указывает ЕР. 


рор — копирование 32-битного значения данных, на которое указывает со- 
держимое регистра ЕЗР в местоположение операнда (регистр или адрес в па- 
мяти), а затем увеличение содержимого ЕЗР на 4. 


риН+а, рор+а — помещение в стек или извлечение из стека регистра ЕРЬАбС$. 


ризпа4, рорад — помещение в стек или извлечение из стека регистров ЕАХ, ЕСХ, 
ЕОХ, ЕВХ, ЕР, ЕВР, Е5Т и ЕОТ в указанном порядке. 


Арифметика и логика 


Арифметические и логические инструкции меняют флаги процессора. Следующие 
инструкции выполняют арифметические и логические операции. 


ад4, зи6 — целочисленное сложение и вычитание. При вычитании второй опе- 
ранд вычитается из первого. Оба операнда могут быть регистрами, или один 
операнд может быть ячейкой памяти, а другой — регистром. Один операнд 
может быть константой. 


адс, $56 — целочисленное сложение и вычитание с использованием флага СЕ в 
качестве входных данных — признака переноса (для сложения) или заимст- 
вования (для вычитания). 


стр — вычитание одного операнда из другого с отбрасыванием результата и 
одновременным обновлением флагов ОЕ, $Е, 22, АЕ, РЕ и СЕ на основании ре- 
зультата. 


пер — отрицание операнда. 
1пс, дес — увеличение или уменьшение операнда на единицу. 


ми] — умножение беззнаковых целых чисел. Размер произведения зависит от 
размера операнда. Операнд размером в байт умножается на А, а результат 
помещается в АХ. Операнд размером в слово умножается на АХ, а результат 
помещается в ОХ:АХ со старшими 16 битами в 0х. Операнд размером в двойное 
слово умножается на ЕАХ, а результат помещается в ЕОХ:ЕАХ. 


1ти1 — умножение знаковых целых чисел. Первый операнд должен быть ре- 
гистром, и в него же помещается результат операции. Всего может быть два 
или три операнда. В форме с двумя операндами первый операнд умножается 
на второй операнд, а результат сохраняется в первом операнде (регистре). 
В форме с тремя операндами второй операнд умножается на третий операнд, 
а результат сохраняется в первом операнде (регистре). В форме с тремя опе- 
рандами третий операнд должен быть непосредственным значением. 
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» 41\, 191у — беззнаковое (41%) или знаковое (191%) деление. Размер результата 
зависит от размера операнда. Операнд размером в байт делится на АХ, частное 
помещается в А+, а остаток — в АН. Операнд размером в слово делится на 
ОХ:АХ, частное помещается в АХ, а остаток — в 0х. Операнд размером в двойное 
слово делится на ЕСХ:ЕАХ, частное помещается в ЕАХ, а остаток — в ЕСХ. 


® апа, ог, хог — соответствующая логическая операция над двумя операндами и 
сохранение результата в местоположении операнда-приемника. 


® поЕ — логическая операция НЕ (инверсия битов) над одним операндом. 


® са1, $11, саг, иг — логический ($11 и °Иг) или арифметический ($а1 и заг) 
сдвиг аргумента размером в байт, слово или двойное слово влево или вправо 
на заданное число позиций — от | до 31 бита. за1 и $11 помещают последний 
сдвинутый бит во флаг переноса и вставляют нули в освободившиеся млад- 
шие значащие биты. Пг помещает последний сдвинутый бит во флаг перено- 
са и вставляет нули в освободившиеся старшие биты. заг отличается от $вг 
распространением бита знака в освободившиеся старшие биты. 


® го], гс1, гог, гсг — операция вращения влево или вправо на 0-31 бит, по вы- 
бору — с помощью флага переноса. гс1 и гсг выполняют операцию вращения 
с использованием флага переноса, а го1 и гог — без его использования. 


® М5, г, Б&с — считывание бита с заданным номером (представленным в ка- 
честве второго операнда) из первого операнда во флаг переноса, а затем уста- 
новка (5$), обнуление (6+г) или дополнение (5+с) этого бита. Этим инструк- 
циям может предшествовать ключевое слово 1оск, делающее данную 
операцию неделимой. 


® е5{ — логическая операция И над двумя операндами и обновление состоя- 
ния флагов $Е, 2Е и РЕ в зависимости от результата. 


Преобразования 
Инструкции преобразования увеличивают размерность значений данных. К этой 
категории относятся следующие инструкции. 

® сб — преобразование байта (регистр А+) в слово (регистр АХ). 

® сима — преобразование слова (регистр АХ) в двойное слово (регистр 0х). 

® слае — преобразование слова (регистр АХ) в двойное слово (регистр ЕАХ). 


® с9а— преобразование двойного слова (регистр АХ) в учетверенное слово (ре- 
гистр ЕБХ:ЕАХ). 


Поток управления 


Инструкции потока управления осуществляют условную или безусловную переда- 
чу выполнения на определенный адрес. 


® пр — передача управления инструкции, расположенной по адресу, который 
указан в качестве операнда. 


298 


Глава 10 


]сс — передача управления инструкции, расположенной по адресу, который 
указан в качестве операнда, если условие сс истинно. Коды условий были 
приведены ранее в описании инструкции спюусс. Условие определяется по од- 
ному или нескольким из следующих флагов процессора: СЕ, 2Е, $Е, ОЕ И РЕ. 


са11 — помещение текущего значения регистра ЕТР в стек и передача управ- 
ления инструкции по адресу, указанному в качестве операнда. 


геё — извлечение верхнего значения из стека и сохранение его в регистре ЕТР. 
Если имеется операнд, эта инструкция извлекает указанное количество бай- 
тов из стека для очистки параметров. 


1оор — уменьшение на единицу значения счетчика 1оор в регистре ЕСХ и, если 
оно не равно нулю, передача управления инструкции, расположенной по ад- 
ресу, который указан в качестве операнда. 


Манипулирование строками 


Инструкции манипулирования строками могут иметь префикс в виде ключевого 
слова гер для повторения операции заданное число раз, которое указывается в реги- 
стре ЕСХ, с увеличением или уменьшением на единицу местоположения источника и 
приемника на каждой итерации, в зависимости от состояния флага ог. Размер опе- 
ранда, обрабатываемого на каждой итерации, может быть равен байту, слову или 
двойному слову. Исходный адрес каждого строкового элемента задается в регистре 
ЕЗТ, а адрес назначения — в регистре ЕоТ. К этой категории относятся следующие 
инструкции: 


тоу — Перемещение строкового элемента. 


стр — сравнение элементов в соответствующих позициях в пределах двух 
строк. 

$са — сравнение строкового элемента со значением в регистре ЕАХ, АХ ИЛИ А, 
в зависимости от размера операнда. 

104$ — загрузка строки в регистр ЕАХ, АХ или А+, в зависимости от размера опе- 
ранда. 


5505 — сохранение содержимого регистра ЕАХ, АХ или АЁ, в зависимости от 
размера операнда, по адресу, записанному в регистр ЕСТ. 


Манипулирование флагами 


Инструкции манипулирования флагами изменяют биты в регистре ЕЕЬАб$. 


5%с, с1с, стс — установка, обнуление или дополнение флага переноса СЕ. 
544, с14 — установка или обнуление флага направления ОЕ. 


541, с11 — установка или обнуление флага прерывания ТЕ. 
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Ввод-вывод 


Инструкции ввода-вывода считывают данные из периферийных устройств или за- 
писывают в них данные. 


е 11, ош — перемещение 1, 2 или 4 байтов между регистром ЕАХ, АХ или АЁ и 
портом ввода-вывода в зависимости от размера операнда. 


® 115, оз — перемещение элемента данных между памятью и портом ввода- 
вывода таким же образом, как это делают инструкции для работы со строками. 


® гер 1п5, гер ошё5 — перемещение блоков данных между памятью и портом 
ввода-вывода таким же образом, как это делают инструкции для работы со 
строками. 


Защищенный режим 


Следующие инструкции открывают доступ к функциям защищенного режима. 


® суепкег, зузех1{ — передача управления с кольца 3 на кольцо 0 ($узепеег) или 
с кольца 0 на кольцо 3 (5узех1*) в процессорах ше. 


® °у5са11, зузгеЕ — передача управления с кольца 3 на кольцо 0 (5у$са11) или с 
кольца 0 на кольцо 3 ($узге*) в процессорах АМО. В режиме х86 (32-разряд- 
ном) процессоры АМО также поддерживают инструкции $узепеег и зузех1*. 


Вспомогательные инструкции 


Эти инструкции не подпадают под категории, перечисленные выше. 


® 11 — инициирование программного прерывания. Операнд — это номер век- 
тора прерывания. 


® пор — без операции. 


® сри14 — предоставление информации о модели процессора и его возможностях. 


Другие категории инструкций 


Инструкции, перечисленные в этом разделе, являются одними из наиболее распро- 
страненных в приложениях х86 и драйверах устройств, помимо описанных в пре- 
дыдущих разделах. Архитектура х86 содержит широкое разнообразие категорий 
инструкций, включая следующие: 


» инструкции вычислений с плавающей запятой — эти инструкции выпол- 
няются в блоках вычислений с плавающей запятой х87; 


» инструкции УМО — к этой категории относятся инструкции ММХ, 55Е, 
95Е2, 55ЕЗ, 55Е4, АУХ, АУХ?2 и АУХ-512; некоторые из наборов инструк- 
ций в этой категории были представлены в разд. "Модель обработки 5МО" 
главы 8; 
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» инструкции АЕЗ — эти инструкции поддерживают шифрование и дешифро- 
вание с использованием усовершенствованного стандарта шифрования 
(а4уапсе4 епсгурНоп запдага, АЕ5); 


е инструкции МРХ: расширения для защиты памяти (тетогу ргоесйоп 
еХЖепз1оп$, МРХ) улучшают целостность памяти, предотвращая ошибки, та- 
кие как переполнение буфера; 


е инструкции ЗМХ: расширения безопасного режима (ЗаЕг тоде 
еХеп$101$, ЗМХ) повышают безопасность системы при наличии решений, 
связанных с доверием пользователям; 


е инструкции Т5Х: расширения для синхронизации транзакций (апзас- 
пбопа| зупсЬгоп1таноп еХ{еп$101$, ТЗХ) повышают производительность при 
многопоточном выполнении с использованием общих ресурсов; 


е инструкции УМХ: расширения для виртуальных машин (ушШиа! тасьте 
еХ!еп5101$, УМХ) обеспечивают безопасную и эффективную поддержку вир- 
туализированных операционных систем. 


Для инструкций с плавающей запятой и 5ПМРО предусмотрены дополнительные ре- 
гистры процессора. 


Помимо перечисленных здесь существует еще ряд категорий инструкций х86, часть 
которых была удалена в более поздних поколениях архитектуры. 


Общие шаблоны использования инструкций 


Ниже приведены примеры шаблонов использования инструкций, с которыми вы 
будете часто сталкиваться в скомпилированном коде. Методы, показанные в этих 
примерах, дают желаемый результат, сводя при этом к минимуму размер кода и 
требуемое количество тактов: 


хог гер, гер ; обнуление гед 
+е5+ гер, гер ; проверка гед на равенство нулю 
ад гер, геев ; сдвиг гед влево на один бит 


Форматы инструкций х8 6 


Отдельные инструкции х86 имеют переменную длину, которая может меняться от 1 
до 15 байт. Компоненты одной инструкции, включая любые необязательные байты, 
размещаются в памяти в перечисленной далее последовательности. 


е Байты префикса. Один или несколько необязательных байтов префикса 
предоставляют вспомогательную информацию о выполнении операции с 
данным опкодом. Например, префикс 1оск блокирует шину в многопроцес- 
сорной системе для выполнения неделимых операций типа "проверить — ус- 
тановить". Префикс гер и его варианты позволяют строковым инструкциям 
выполнять повторяющиеся операции над строковыми элементами в рамках 
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одной инструкции. Другие префиксы предоставляют указания для инструк- 
ций условного ветвления или для переопределения принятого по умолчанию 
размера адреса или операнда. 


е Байты кода операции (опкода). За любыми байтами префикса следует оп- 
код архитектуры х86, состоящий из 1-3 байтов. Для некоторых кодов опера- 
ций дополнительные три бита опкода кодируются в байте МоаК/М, следую- 
щим за этим опкодом. 


е Байт МодВЛМ. Этот байт требуется не для всех инструкций. Байт МоаК/М 
содержит три информационных поля, предоставляющих информацию о ре- 
жиме адресации и регистровых операндах. Два старших бита этого байта (по- 
ле Мод) и три его младших бита (поле ^/М) объединяются, формируя поле из 
5 бит с 32 возможными значениями. Из них 8 значений идентифицируют ре- 
гистровые операнды, а остальные 24 значения определяют режимы адреса- 
ции. Оставшиеся 3 бита (поле гер/орсоае) указывают регистр либо содержат 
три дополнительных бита опкода в зависимости от инструкции. 


е Байты смещения адреса. 0, 1, 2 или 4 байта обеспечивают смещение адреса, 
используемое при вычислении адреса операнда. 


е Байты непосредственного значения. Если инструкция включает в себя не- 
посредственное значение, оно находится в последних 1, 2 или 4 байтах инст- 


рукции. 


Переменная длина инструкций х86 делает процесс их декодирования довольно 
сложным. Кроме того, у инструментов отладки могут возникнуть затруднения с 
разбором последовательности инструкций в обратном порядке, что может потребо- 
ваться для отображения кода, предшествующего контрольной точке. 


Эти трудности возникают из-за того, что завершающая последовательность байтов 
в длинных инструкциях может сформировать полную допустимую инструкцию. 
Такие сложности являются заметным отличием от более привычных форматов ин- 
струкций, используемых в архитектурах В]$С. 


Язык ассемблера х86 


На языке ассемблера можно разрабатывать программы любого уровня сложности. 


Однако большинство современных приложений в значительной степени или пол- 
ностью разрабатывают на языках высокого уровня. Язык ассемблера, как правило, 
используют в тех случаях, когда возникает необходимость в специализированных 
инструкциях или требуется экстремальная оптимизация, недостижимая с помощью 
оптимизирующего компилятора. 


Независимо от языка, используемого при разработке приложений, весь код в ко- 
нечном счете должен выполняться в виде инструкций процессора. Для полного по- 
нимания того, как выполняется код в компьютерной системе, нет иного пути, кроме 
изучения состояния системы после выполнения каждой отдельной инструкции. Хо- 
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рошим способом научиться понимать и работать в этой среде является написание 
некоторого кода на ассемблере. 

Пример на языке ассемблера х86 в следующем листинге представляет собой закон- 
ченное приложение х86, которое запускается из командной консоли \М доу, печа- 
тает строку текста и затем завершает работу. 


.386 
.тоде] ЕЕАТ,С 
.5фаск 49010 


. соде 
1пс1иде116 116стё.116 
1пс1иде116 1ерасу_5%4910_ае+1п110оп$.116 


ехЕегп рг1п:пеаг ехёегп ех1*:пеаг 


риб11с та1п 

ма1п ргос 
; Печать сообщения 
риз  О+РзеЕ теззаве 
са11 — рг1пЕ+ 


; Выход из программы с кодом состояния @ 


ризв © 
са11 ех1+ 
ма1п епар 
„дата 


меззаре 46 "Привет, архитектор компьютеров!" ‚0 


епа 


Ниже приведено описание содержимого этого файла на языке ассемблера. 


»е Директива .386 указывает, что инструкции в этом файле следует интерпрети- 
ровать как инструкции для процессоров 80386 и более поздних поколений. 


» Директива .тоюде1 ЕЁАТ,С определяет 32-разрядную плоскую модель памяти и 
использование соглашений о вызове функций на языке С. 


» Директива .5%аск 49ен определяет размер стека в 4006 (1024) байт. 


® Директива .соде указывает на начало исполняемого кода. 
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» Директивы 1пс1и4е116 и ехкегп ссылаются на предоставляемые системой биб- 
лиотеки и функции в них, которые будут использоваться программой. 


» Директива риб11с указывает, что имя функции пта1п является видимым извне. 


» Строки между та1п ргос и таёп епар содержат инструкции на языке ассембле- 
ра, составляющие функцию па1п. 


»е Директива „даа указывает на начало памяти данных. Выражение пеззаве 46 
определяет строку сообщения как последовательность байтов, за которой 
следует нулевой байт. 


»е Директива епа отмечает окончание программы. 


Этот файл с именем пе11о_х86.азт транслируется и компонуется для получения ис- 
полняемого файла программы 1е110_х86.ехе с помощью следующей команды, кото- 
рая запускает Мтсгозой Масго АззетЫег: 


т? /ЕТ /71 /2а Ве11о_х86.азт 


Компоненты этой команды: 
» т] запускает ассемблер (т1.ехе); 
» /Е1 создает файл листинга; 


» /74 включает в исполняемый файл отладочную информацию об используе- 
мых в программе именах; 


» /74 включает в исполняемый файл отладочную информацию о номерах строк; 
® Пе110_х86.азт — это имя исходного файла на языке ассемблера. 


Ниже показана часть файла листинга 1е11о_х86.1$+, сгенерированного ассемблером. 


.386 
.то4де1 ЕЁАТ,С 
.5фаск 4901 
00000000 . сое 
1пс1и4де116 116стё.116 
1пс1иае116 1ерасу_$%41о_де1п1«10оп$.116 


ехфегпт рг1п+:пеаг 
ехфегп ех1*:пеаг 


риб11с та1п 
боее0ее0 та1п ргос 
; Печать сообщения 
оееоеоеее 68 00000000 В ризп  о+5еф меззаре 
00000005 Е8 00000000 Е са1]1  ргГ\Е+ 
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; Выход из программы с кодом состояния © 


оое00е00А 6А 00 ризн 0 
оееоее0с Е8 00000000 Е са1]1 ех4 
00000011 ма1п епар 
ве000е0е0 .дака 


00000000 48 65 6С 6С 6Е теззаве 46 "Привет, архитектор компьютеров!" ‚0 
2С 20 43 6Е 
70 75 74 65 72 
20 41 72 63 68 
69 74 65 63 74 
21 00 


В левом столбце этого листинга отображаются смещения адресов от начала функ- 
ции па1т. В строках, содержащих инструкции, за смещением адреса следует код 
операции. Адресные ссылки в коде (например, о+Езее теззаве) отображаются в лис- 
тинге в виде 0ее0е0ее, т. к. их значения определяются во время компоновки, а не в 
ходе трансляции, когда создается этот листинг. 


Ниже показаны выходные данные, отображаемые при запуске программы. 


С:\>Пе11]0_ х86.ехе 


Привет, архитектор компьютеров! 


Далее мы рассмотрим расширение 32-разрядной архитектуры х86 до 64-разрядной 
архитектуры х64. 


Архитектура и набор инструкций хб4 


Исходная спецификация для процессорной архитектуры, расширяющая процессор 
х86 и набор инструкций до 64 разрядов и получившая название АМО64, была пред- 
ставлена компанией АМР в 2000 г. Первый процессор АМО64, Орегоп, был выпу- 
щен в 2003 г. Пце|, обнаружившая свое отставание от АМЮ, разработала архитектуру, 
совместимую с АМО64, которая в итоге была названа Пие! 64. Первым процессо- 
ром Ни с 64-разрядной архитектурой стал Хеоп, представленный в 2004 г. Архи- 
тектурам АМО и ше] дали общее название х86-64, отражающее развитие от х86 до 
64 бит. В общепринятом использовании этот термин был сокращен до х64. 


Первая версия Глиих, поддерживающая архитектуру х64, была выпущена в 2001 г., 
задолго до появления первых процессоров х64. В У т4о\$ поддержка архитектуры 
х64 была добавлена в 2005 г. 


Процессоры, реализующие архитектуры АМО64 и шк! 64, в значительной степени 
совместимы на уровне набора инструкций для программ пользовательского режи- 
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ма. Существует несколько различий между этими архитектурами, наиболее значи- 
тельным из которых является разница в поддержке инструкций ш&! узепкег/узех1* 
и инструкций АМО $уса11/5узгее, которую мы обсуждали ранее. 


В целом операционные системы и компиляторы языков программирования справ- 
ляются с этими различиями, поэтому они редко становятся предметом внимания 
разработчиков программного обеспечения и систем. Разработчики программного 
обеспечения ядра, драйверов и ассемблерного кода должны учитывать эти различия. 


Основные особенности архитектуры х64 таковы. 


» х64 — это в основном совместимое 64-разрядное расширение 32-разрядной 
архитектуры х86. Большинство программ, особенно приложений пользователь- 
ского режима, написанных для 32-разрядной среды, должны выполняться без 
изменений на процессоре, работающем в 64-разрядном режиме. 64-разрядный 
режим также называют длинным режимом. 


» Восемь 32-разрядных регистров общего назначения х86 в хб4 расширены до 
64 разрядов. На 64-разрядные регистры указывает префикс имени регистра В. 
Например, в хб4 расширенный регистр х86 ЕАХ называется ВАХ. Подкомпонен- 
ты регистров х86 ЕАХ, АХ, АН и АЕ остались доступными и в хб4. 


» Указатель инструкций ВТР расширен до 64 бит. Регистр флагов ВЕГАб$ также 
охватывает 64 бита, хотя его старшие 32 бита зарезервированы. Младшие 
32 бита регистра ВЕЁАб$ аналогичны ЕЕЬАб$ в архитектуре х86. 


» Были добавлены восемь 64-разрядных регистров общего назначения, полу- 
чивших названия от 88 до 815. 


» 64-разрядные целые числа поддерживаются в качестве собственного типа 
данных. 


» Процессоры х64 сохраняют возможность работы в режиме совместимости с 
х86. Этот режим поддерживает 32-разрядные операционные системы и по- 
зволяет любому приложению, созданному для х86, работать на процессорах 
хб4. В режиме совместимости с 32-разрядной средой 64-разрядные расшире- 
ния недоступны. 


Виртуальные адреса в архитектуре хб4 имеют разрядность 64 бита, поддерживая 
адресное пространство размером 16 эксабайт (Эбайт), что эквивалентно 2“ бай- 
там. Однако современные процессоры АМО и шё| поддерживают только 48 бит 
виртуального адресного пространства. Это ограничение снижает аппаратную слож- 
ность процессора, сохраняя при этом поддержку до 256 терабайт (Тбайт) вирту- 
ального адресного пространства. Процессоры текущего поколения также поддер- 
живают максимум 48 бит физического адресного пространства. Это позволяет 
процессору обрабатывать 256 Тбайт физической оперативной памяти, хотя совре- 
менные материнские платы не поддерживают количество устройств ОКАМ, кото- 
рое может потребоваться такой системе. 
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Набор регистров архитектуры хб.4 


В архитектуре хб4 расширение размера регистров х86 до 64 бит и добавление реги- 
стров ®8—815 дают карту регистров, показанную на рис. 10.3. 


64 бита вОХ 
32 бита 

16 бит 

8 бит 


Рис. 10.3. Регистры архитектуры х64 


На рис. 10.3 регистры х86, описанные в предыдущем разделе (и присутствующие в 
х64), имеют более темный фон. При работе в 64-разрядном режиме регистры х86 
имеют прежние имена и размеры. 


Расширенные 64-разрядные версии регистров х86 имеют имена, начинающиеся с 
буквы К. Предусмотрена возможность доступа к меньшим частям новых регистров 
64-разрядной архитектуры (в8—815) с помощью соответствующей буквы суффикса: 


» суффикс О обеспечивает доступ к младшим 32 битам регистра: 8110; 
» суффикс У обеспечивает доступ к младшим 16 битам регистра: В11и; 
» суффикс В обеспечивает доступ к младшим 8 битам регистра: 8118. 


В отличие от регистров х86, новые регистры в архитектуре хб4 имеют действитель- 
но общее назначение и не выполняют никаких специальных функций на уровне 
инструкций процессора. 
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Категории и форматы инструкций хб4 


Архитектура х64 реализует по существу тот же набор инструкций, что и х86, но с 
расширениями для 64-разрядной среды. При работе в 64-разрядном режиме архи- 
тектура хб4 по умолчанию использует адреса размером 64 бита и операнды разме- 
ром 32 бита. Новый байт префикса гех кода операции определяет использование 
64-разрядных операндов. 


Формат инструкций х64 в памяти соответствует формату архитектуры х86 с неко- 
торыми незначительными для наших целей исключениями. Добавление поддержки 
байта префикса гех является наиболее значительным отличием от формата инст- 
рукций х86. Смещения адресов и непосредственные значения в некоторых инст- 
рукциях могут иметь разрядность 64 бита в дополнение ко всем прочим вариантам 
разрядности, поддерживаемым в х86. 


Несмотря на возможность определить инструкции длиной более 15 байт, декодер 
инструкций процессора выдаст ошибку общей защиты, если будет предпринята по- 
пытка декодировать инструкцию длиной более 15 байт. 


Язык ассемблера хб4 


Исходный файл на ассемблере хб4 для программы пе11о похож на версию этого ко- 
да для х86, с некоторыми примечательными отличиями. 


» Отсутствует директива, определяющая модель памяти, поскольку в хб4 суще- 
ствует только одна модель памяти. 


»е В интерфейсе программирования приложений (аррИсаНоп ргоргаттшре т- 
1е асе, АРГ) \У/1190\$ хб4 используется соглашение о вызове, которое сохра- 
няет первые четыре аргумента вызываемой функции в регистрах ВСХ, ВОХ, 88 и 
9 в указанном порядке. Этот подход отличается от принятого по умолчанию 
соглашения о вызовах х86, согласно которому параметры помещаются в стек. 
Обе библиотечные функции, вызываемые этой программой (рг1пЕР и ех1*), 
получают один аргумент, передаваемый через регистр вСХ. 


® Соглашение о вызове требует, чтобы вызывающая функцию программа вы- 
деляла пространство стека для хранения как минимум того количества аргу- 
ментов, которые передаются вызываемой функции, с минимальным резерви- 
рованием пространства под четыре аргумента, даже если число передаваемых 
аргументов меньше. Поскольку стек растет в памяти вниз, для этого требует- 
ся вычитание из указателя стека. Такое резервирование стека выполняет ин- 
струкция зи6 гзр, 49. После возврата из вызванной функции для отмены этого 
резервирования обычно требуется корректировка указателя стека. Наша про- 
грамма для завершения выполнения вызывает функцию ех1*, что делает этот 
шаг ненужным. 
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Код 64-разрядной версии программы Вео выглядит следующим образом: 


„соае 
1пс1и4е]16 116стё.116 
1пс]иде116 ]ерасу_5%41о_деф1тп11оп$.116 


ехЕегп рг1п:пеаг 


ехфегп ех1* : пеаг 


руб11с тафп 


ма1п ргос 


; Резервирование места в стеке 
$иБ гзр, 49 


; Печать сообщения 
]еа гсх, тез5аре 
са1]1 — рг1пЕ 


; Выход из программы с кодом состояния 9 
хог гсх, гсх 
са1]1 ех1 


ма1п епар 


„Дата 
теззаве 46 "Привет, архитектор компьютеров!" ‚0 


епа 


Этот файл с именем пе11о_х64.азт транслируется и компонуется для получения ис- 
полняемого файла программы ве11о_х64.ехе с помощью следующего вызова М!- 
сго5ой Масго Аз5зетЫег (версия х64): 


1164 /Е1 /21 /24 Пе11о_х64.азт 


Компоненты этой команды: 


1164 запускает 64-разрядный ассемблер; 
/Е1 создает файл листинга; 


/21 включает в исполняемый файл отладочную информацию об используе- 
мых в программе именах; 


/24 включает в исполняемый файл отладочную информацию о номерах строк; 


Ке11о_х64.азт — это имя исходного файла на языке ассемблера. 
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Ниже показана часть файла листинга пе11о_хб4.15%, сгенерированного этой коман- 
дой ассемблера: 


0е0ее0е0 .соде 
1пс1иде116 116сте. 11 
1пс1и4е]116 1ерасу_$+41о_4е1п1{10п$.116 


ехфегп рг1п+:пеаг 


ехёегп ех1+:пеаг 


риб11с та1п 


@ое000е0 тма1п ргос 
; Резервирование места в стеке 
00000000 48/ 83 ЕС 28 $и6 гзр, 49 


; Печать сообщения 


оее0е00д 48/ 80 @0 1еа гсх, теззаве 
00000000 В 
оееоееев ЕЗ 00000000 Е са11 рг1"Е+ 


; Выход из программы с кодом состояния © 


00000010 48/ 33 С9 хог гсх, гсх 
00000013 ЕЗ 00000000 Е са1] —ех1 
00000018 та1п епар 

т) „дака 


00000000 48 65 6С 6С 6Е теззаве 46 "Привет, архитектор компьютеров!" ‚0 
2С 20 43 6: 
70 75 74 65 72 
20 41 72 63 68 
69 74 65 63 74 
21 00 


Результат запуска этой программы выглядит следующим образом: 


С: \>Не11о_х64.ехе 


Привет, архитектор компьютеров! 


На этом наше краткое знакомство с архитектурами х86 и хб4 завершается. Но здесь 
еще есть чему поучиться — издание "/ие! 64 апа Г[А-32 Агсйиесигез боймаге 
Деуеюре!’5 Мапиа!", уоитеху 1-4 ("Руководство разработчика программного обес- 
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печения для архитектур те! 64 и [А-32", тома 1-4) содержит почти 5000 страниц 
подробной документации по этим архитектурам. В этой главе мы затронули лишь 
малую часть этой темы. 


Далее мы проведем аналогичную обзорную экскурсию по 32-разрядным и 64-разряд- 
ным архитектурам АВМ. 


Архитектура и набор инструкций 
32-разрядных процессоров АКМ 


Архитектуры АКМ определяют семейство В1ЗС-процессоров, подходящих для ре- 
шения самых разнообразных практических задач. Процессоры, основанные на ар- 
хитектуре АКМ, предпочтительны в решениях, где требуется сочетание высокой 
производительности, низкого энергопотребления и компактных физических размеров. 


Архитектуры АВМ разработала британская компания по производству полупро- 
водников и программного обеспечения АКМ Но!9112$, которая предоставляет ли- 
цензии на свою продукцию другим компаниям, изготавливающим процессоры. Ар- 
хитектура АВМ находит широкое применение в виде систем на кристалле 
(Зужет-Оп-Сыр, $0С), сочетающих процессор со специализированными аппарат- 
ными средствами для реализации таких функций, как сотовая радиосвязь в смарт- 
фонах. 


Процессоры АКМ используются в самых разных областях — от крошечных уст- 
ройств на батарейках до суперкомпьютеров. Эти процессоры работают в качестве 
встроенных процессоров в критически важных для безопасности системах, таких 
как антиблокировочные тормозные системы автомобилей, и в качестве процессоров 
общего назначения в умных часах, мобильных телефонах, планшетах, ноутбуках, 
настольных компьютерах и серверах. По состоянию на 202] г. было произведено 
более 180 млрд процессоров АВМ. 


Процессоры АКМ — это полноценные ВГЗС-системы с большим набором регист- 
ров общего назначения и однотактным выполнением большинства инструкций. 
Стандартные инструкции АКМ имеют фиксированный размер 32 бита, хотя для 
систем, где приоритет отдается объему памяти, доступен отдельный набор инст- 
рукций переменной длины Т32 (ранее его называли ТВитЬ). Набор инструкций 
Т32 сочетает в себе 16- и 32-разрядные инструкции. 


Процессоры АКМ текущего поколения поддерживают как набор инструкций 
АВМ, так и ТЗ2 и могут переключаться между этими двумя наборами в процессе 
работы. Большинство операционных систем и приложений предпочитают исполь- 
зовать набор инструкций ТЗ32, а не набор АКМ, поскольку это помогает повысить 
плотность кода. 


АЕМ — это архитектура загрузки/сохранения, требующая загрузки данных из 
памяти в регистр, прежде чем с ними могут быть выполнены какие-либо операции, 
например обработка в АЛУ. Последующая инструкция сохраняет результат обрат- 
но в память. Это может показаться шагом назад по сравнению с архитектурами х86 
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и хб4, которые работают непосредственно с операндами в памяти в рамках одной 
инструкции, однако на практике подход с загрузкой/сохранением позволяет с высо- 
кой скоростью выполнять несколько последовательных операций над операндом 
сразу после его загрузки в один из многих регистров процессора. 


Процессоры АКМ поддерживают переключаемый порядок байтов. Предусмотрен 
параметр конфигурации для выбора прямого или обратного порядка байтов для 
многобайтовых значений. Значение по умолчанию — прямой порядок байтов, т. к. 
эту конфигурацию обычно используют операционные системы. 


Архитектура АВМ имеет встроенную поддержку следующих типов данных: 
» БуЕ (байт) — 8 бит; 
е ПВаНуога (полуслово) — 16 бит; 
» уога (слово) — 32 бита; 


е доцЫеууога (двойное слово) — 64 бита. 


КАКОВА ДЛИНА СЛОВА? 


существует разница, которая может вызвать путаницу: в х86 и хб4 слово 
имеет длину 16 бит, а двойное слово — 32 бита. В АКМ слово состоит 
из 32 бит, а двойное слово — из 64 бит. 


4 Между типами данных в архитектуре АКМ и архитектурах х86 и х64 


Процессоры АКМ поддерживают восемь режимов работы с различными привиле- 
гиями выполнения. Ниже приведен список этих режимов и их сокращения: 


е пользовательский режим (изег, ЗК); 

е режим супервизора (5прегу1зог, ЗУС); 

» режим быстрого прерывания (1251 пиегирЕ гедиезь ЕТО); 
е режим обычного прерывания (п(егтир! гедиезь ВО); 

» режим мониторинга (топйог, МОМ); 

е режим останова (абоп, АВТ); 

е неопределенный режим (ЦМО); 

» системный режим (5у$ет, 5У5). 


Для целей операционных систем и пользовательских приложений наиболее важны- 
ми уровнями привилегий являются О ЗВ и ЗУС. Два режима запроса прерываний, 
НО и ГКО, используются драйверами устройств для обработки прерываний. 


В большинстве операционных систем, работающих на процессорах АЕМ, включая 
У/Лпдо\5 и Глпих, ядро функционирует в режиме АВМ $УС, эквивалентном кольцу 
0 вх86/хб4. Режим ИК в АКМ эквивалентен кольцу 3 в х86/х64. Приложения, ра- 
ботающие под управлением Глпих на процессорах АКМ, используют программные 
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прерывания для запроса сервисов ядра, что предполагает переход из режима (ЗВ в 
режим ЗУС. 


Архитектура АВМ предоставляет системные возможности, выходящие за рамки 
возможностей главного процессора, посредством концепции сопроцессоров. Каж- 
дый сопроцессор реализует специализированную категорию функциональных воз- 
можностей, обеспечивая поддержку главного процессора. В системе может быть 
реализовано до 16 сопроцессоров, четырем из которых назначены предопределен- 
ные функции. 


Сопроцессор 15 реализует блок управления памятью (ММО) и другие системные 
функции. При наличии в системе сопроцессор 15 должен поддерживать опкоды 
инструкций, набор регистров и варианты поведения, установленные для ММЦ. Со- 
процессоры 10 и 11 объединяются для реализации операций с плавающей запятой в 
процессорах, оснащенных этой функцией. Сопроцессор 14 обеспечивает поддержку 
функций отладки. 


За прошедшие годы было выпущено несколько версий архитектуры АКМ. В на- 
стоящее время широко используется версия архитектуры АВМуУ8-А, поддержи- 
вающая 32- и 64-разрядные операционные системы и приложения. 32-разрядные 
приложения могут работать под управлением 64-разрядной операционной системы 
АВМУ8-А. 


Практически все высококлассные смартфоны и мобильные устройства, выпускав- 
шиеся с 2016 г., спроектированы на базе процессоров или систем на кристалле (ОС), 
основанных на архитектуре АКМУ8-А. В следующем повествовании основное вни- 
мание будет уделено 32-разрядному режиму АКМ\У8-А. Отличия 64-разрядного ре- 
жима АВМУ8-А мы рассмотрим в одном из следующих разделов этой главы. 


Набор регистров АВМ 


В режиме ИЗК архитектура АВМ имеет шестнадцать 32-разрядных регистров об- 
щего назначения: от В@ до 815. Первые 13 регистров имеют действительно общее 
назначение, а остальные три выполняют следующие функции. 


» 813 — это указатель стека, также называемый $Р в ассемблерном коде. Этот 
регистр указывает на вершину стека. 


» 814 — это регистр связи, также называемый 1в. Он содержит адрес возврата 
во время выполнения вызываемой функции. Использование регистра связи 
отличается от архитектуры х86/х64, где адрес возврата помещается в стек. 


Причина использования регистра для хранения адреса возврата заключается в 
том, что после завершения функции значительно быстрее возобновить вы- 
полнение по адресу в 1в, чем извлечь адрес возврата из стека и возобновить 
выполнение по этому адресу. 


е 815 — это программный счетчик, также называемый РС. Из-за конвейерной 
обработки значение, содержащееся в РС, обычно на две инструкции опережа- 
ет выполняемую в данный момент инструкцию. В отличие от х86/х64, поль- 
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зовательский код может напрямую считывать и записывать данные в регистр 
РС. Запись адреса в РС приводит к немедленному переходу выполнения к 
только что записанному адресу. 


Регистр текущего состояния программы (сигтепе ргогтат ${ав$ герлуег, СРК) 
содержит биты состояния и управления режимом, аналогичные ЕЕГАб$/ВЕТАС$ в архи- 
тектурах х86/х64 (табл. 10.3). 


Таблица 10.3. Отдельные биты регистра СР$К 


ЕС нии 


мо [Режим текущий уровень привилегий выполнения (ОЗК, ЗУС ит. д.) 


"ТритЬ": установлен, если активен набор инструкций Т32 (ТБитЪ). 
Если этот бит обнулен, то активен набор инструкций АКМ. Устано- 
вить и обнулить этот бит можно с помощью пользовательского кода 


Порядок байтов: установка этого бита включает режим с обратным 
порядком байтов. Если этот бит обнулен, то включен режим с пря- 
мым порядком байтов. В большинстве программ используется режим 
с прямым порядком байтов 


Флаг кумулятивного насыщения: устанавливается, если в какой-то 
момент в серии операций произошло переполнение или насыщение 


Флаг переполнения: устанавливается, если операция привела к пере- 
полнению со знаком 


Флаг переноса: указывает, привело ли сложение к переносу или вы- 
читание к заимствованию 


Флаг нуля: устанавливается, если результат операции равен нулю 


31 Флаг отрицательного знака: устанавливается, если результат опера- 
ции отрицателен 


Биты регистра СРЗК, не указанные в табл. 10.3 либо зарезервированы, либо отно- 
сятся к функциям, не обсуждаемым в этой главе. 


По умолчанию большинство инструкций не влияют на эти флаги. Для того чтобы 
результат выполнения инструкции оказал влияние на флаги, к ней необходимо до- 
бавить суффикс $. Например, в случае инструкции сложения: ада. Инструкции 
сравнения являются исключением из этого правила; они обновляют флаги автома- 
тически. 


Режимы адресации АВМ 


В стиле истинной концепции К!$С единственные инструкции АКМ, которые могут 
получить доступ к системной памяти, — это инструкции загрузки данных в регист- 
ры и сохранения данных из них. 
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Инструкция 194г загружает в регистр данные из памяти, а инструкция $1г — сохра- 
няет содержимое регистра в ячейку памяти. Отдельная инструкция, пом, перемещает 
данные из одного регистра в другой или помещает в регистр непосредственное зна- 
чение. 


При вычислении целевого адреса для операции загрузки или сохранения АКМ на- 
чинает с базового адреса, указанного в регистре, и добавляет приращение для по- 
лучения целевого адреса памяти. Существует три метода определения приращения, 
которое должно быть добавлено к содержимому базового регистра в инструкциях 
загрузки и сохранения данных регистра. 


е Смещение. В базовый регистр добавляется знаковая константа. Смещение 
сохраняется как часть инструкции. Например, инструкция 14г г@, [г1, #19] 
загружает в г@ слово по адресу г1+19. Как показано в следующих примерах 
режима адресации, целевой адрес в базовом регистре может быть проиндек- 
сирован до или после обращения к ячейке памяти. 


»е Регистр. Беззнаковое приращение, хранящееся в регистре, может быть до- 
бавлено к значению в базовом регистре или вычтено из него. Например, ин- 
струкция 14" г@, [г1, г2] загружает в г@ слово по адресу г1+г2. В качестве ба- 
зового регистра можно рассматривать любой из регистров. 


е Регистр с масштабированием. Перед добавлением к значению в базовом ре- 
гистре или вычитанием из него приращение в регистре сдвигается влево или 
вправо на указанное количество битовых позиций. Например, инструкция 
14" г@, [г1, г2, 1$1 #3] загружает в ге слово по адресу г1+(г2х8). Можно ис- 
пользовать логический сдвиг влево или вправо, 151 или 1$г, с дополнением 
освободившихся битовых позиций нулями, или арифметический сдвиг впра- 
во, азг, с повторением знакового бита в освободившихся позициях. 


В следующих разделах представлены режимы адресации, используемые для указа- 
ния операндов-источников и операндов-приемников в инструкциях АКМ. 


Непосредственное значение 


Непосредственное значение вводится как часть инструкции. Возможные непосред- 
ственные значения представляют собой закодированные в инструкции 8-битные 
значения с вращением на четное число битовых позиций. Полное 32-разрядное зна- 
чение указать нельзя, т. к. сама инструкция имеет ширину не более 32 бит. Для того 
чтобы загрузить в регистр произвольное 32-разрядное значение, следует использо- 
вать инструкцию 14г для загрузки значения из памяти: 


тоу г@, #10 // Загрузка 6 г@ десятичного значения 10 6 32-разрядном формате 
моу го, #9хгЕ000000 // Загрузка 86 г@ 32-разрядного значения ЕЕ@Ф@Ф@ОР 


Второй пример содержит 8-битное значение ЕЕИ в опкоде инструкции. Во время вы- 
полнения осуществляется поворот влево на 24 битовые позиции до старших 8 бит 
этого слова. 
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Прямая регистровая адресация 


В этом режиме один регистр копируется в другой: 


пюу г@, г1 // Копирование г1 8 г9 
туп г@, г1 // Копирование НЕ(г1) 8 г 


Косвенная регистровая адресация 


В регистре предоставляется адрес операнда. Обозначение регистра, содержащего 
адрес, заключено в квадратные скобки: 


14г г@, [г1] // загрузка 6 г@ 32-разрядного значения по адресу, указанному 6 г1 
$4г г@, [г3] // Сохранение г@ по адресу, указанному 6 г3 


В отличие от большинства инструкций, $*1г использует первый операнд в качестве 
источника, а второй — в качестве приемника. 


Косвенная регистровая адресация со смещением 


Адрес операнда вычисляется путем добавления смещения к базовому регистру: 


14г ге, [г1, #32] // Загрузка 6 г@ значения по адресу [г1+32] 
${г г@, [г1, #4] // Сохранение г@ по адресу [г1+4] 


Косвенная регистровая адресация со смещением 
м преинкрементом 


Адрес значения определяется путем добавления смещения к базовому регистру. 
В базовый регистр помещается вычисленный адрес, и этот адрес используется для 
загрузки значения в целевой регистр: 


19г ге, [г1, #32]! // Загрузка 6 г@ [г1+32] и обновление г1 до (г1+32) 
$4г го, [г1, #4]! // Сохранение г@ по адресу [г1+4] и обновление г1 до (г1+4) 


Косвенная регистровая адресация со смещением 
и постинкрементом 


Сначала базовый адрес используется для доступа к ячейке памяти. Затем в базовый 
регистр помещается вычисленный адрес: 


14г г@, [г1], #32 // Загрузка [г1] 6 г@, затем обновление г1 до (г1+32) 
$4г г@, [г1], #4 // Сохранение г@ по адресу [г1], затем обновление г1 до (г1+4) 
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Косвенная регистровая адресация 
с двумя регистрами 


Адрес операнда представляет собой сумму базового регистра и регистра прираще- 
ния. Имена регистров заключены в квадратные скобки. 


14г го, [г1, г2] // загрузка 86 г@ адреса [г1+г2] 
$4г г@, [г1, г2] // Сохранение г@ по адресу [г1+г2] 


Косвенная регистровая адресация 
с двумя регистрами и масштабированием 
Адрес операнда представляет собой сумму базового регистра и регистра прираще- 


ния со сдвигом влево или вправо на заданное число битов. Имена регистров и ин- 
формация о сдвиге заключены в квадратные скобки. 


19г г@, [г1, г2, 1$1 #5] // Загрузка 6 г@ адреса [г1+(г2*32)] 
$4г г@, [г1, г2, 15г #2] // Сохранение г@ по адресу [г1+(г2/4)] 


В следующем разделе представлены общие категории инструкций АКМ. 


Категории инструкций АВМ 


Инструкции, описанные в этом разделе, взяты из набора Т32. 


Загрузка/сохранение 


Эти инструкции перемещают данные между регистрами и памятью. 


» 14г, 55г — перемещение 8-битного (суффикс Ь для байта), 16-битного (суф- 
фикс п для полуслова) или 32-битного значения между регистром и ячейкой 
памяти. 14" копирует значение из памяти в регистр, а г копирует содержи- 
мое регистра в память. 19г6 копирует 1 байт в младшие 8 бит регистра. 


® 10т, $&т — загрузка или сохранение содержимого нескольких регистров. С их 
помощью можно копировать от |1 до 16 регистров в память или из нее. На- 
пример, инструкция 19дт г1, {г@, г2, г4-г11} загружает в регистры г®, г2 и от 
г4 ДО г11 данные из непрерывной области памяти, начиная с адреса, указанно- 
го в г1. С помощью этих инструкций можно загрузить из памяти или сохра- 
нить в ней содержимое любого подмножества регистров. 


Манипулирование стеком 


Эти инструкции сохраняют данные в стеке и извлекают их из него. 


е ризй, рор — помещение в стек или извлечение из стека любого подмножества 
регистров, например: ризВ {г@, г2, г4-г11}. Эти инструкции являются вариан- 
тами инструкций 1дт И $4м. 
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Перемещение между регистрами 


Эти инструкции перемещают данные между регистрами. 


® по\, пп — перемещение содержимого регистра (то\у) или результата побито- 
вой инверсии содержимого регистра (пуп) в регистр назначения. 


Арифметика и логика 


Эти инструкции, как правило, имеют один регистр назначения и два операнда- 
источника. Первый операнд-источник — это регистр, а второй операнд может быть 
регистром, сдвинутым регистром или непосредственным значением. 


При добавлении суффикса $ эти инструкции устанавливают флаги условий. Напри- 
мер, а44$ выполняет сложение и устанавливает флаги условий. 


® а04, 46 — сложение или вычитание двух чисел. Например, инструкция 
а4Ф г@, г1, г2, 151 #3 эквивалентна выражению #7 = и; + (72 х 23). Оператор 151 
выполняет логический сдвиг второго операнда, г2, влево. 


® аас, $5с — сложение или вычитание двух чисел с переносом или заимствова- 
нием. 


» пер — отрицание числа. 
® апа, огг, еог — логические операции И, ИЛИ и "исключающее ИЛИ". 


® огп, еоп — логические операции ИЛИ и "исключающее ИЛИ" с использовани- 
ем первого операнда и результата побитовой инверсии второго операнда. 


® 51с — обнуление выбранных битов в регистре. 
» ти — перемножение двух чисел. 


® Ма— перемножение двух чисел с накоплением результата. Эта инструкция 
содержит дополнительный операнд для указания регистра-накопителя. 


® 541\, идалу — знаковое и беззнаковое деление соответственно. 


Сравнение 


Эти инструкции сравнивают два значения и устанавливают флаги условий на осно- 
ве результата сравнения. Суффикс $ в этих инструкциях для установки флагов ус- 
ловий не требуется. 


® стр — вычитание одного числа из другого с отбрасыванием результата и ус- 
тановкой флагов условий. Эта инструкция эквивалентна инструкции 5и6$ за 
исключением отбрасывания результата. 


® ст — сложение двух чисел с отбрасыванием результата и установкой флагов 
условий. Эта инструкция эквивалентна инструкции ада$, за исключением от- 
брасывания результата. 


® {5+ — побитовая операция И с отбрасыванием результата и установкой фла- 
гов условий. Эта инструкция эквивалентна инструкции апд$, за исключением 
отбрасывания результата. 
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Поток управления 


Эти инструкции выполняют условную или безусловную передачу управления по 
целевому адресу. 


» Б — безусловный переход к целевому адресу. 


® сс — условный переход на основании одного из следующих кодов условий, 
обозначенных сс: ед (равно), пе (не равно), 5+ (больше), 14 (меньше), ве (боль- 
ше или равно), 1е (меньше или равно), с5 (установка флага переноса), сс (об- 
нуление флага переноса), тё (минус: флаг М=1), р1 (плюс: флаг М=0), 
\5 (флаг У установлен), ус (флаг У обнулен), №1 (выше: флаг С установлен, 
а флаг 7, обнулен) или 1$ (ниже или равно: флаг С обнулен, и флаг 7, обнулен). 


® Б1 — переход по указанному адресу с сохранением адреса следующей инст- 
рукции в регистре связи (г14, также называемом 1г). Для возврата из вызы- 
ваемой функции в вызывающий код используется инструкция том рс, ]1г. 


» Бх — переход с выбором набора инструкций. Если бит 0 целевого адреса ра- 
вен 1, выполняется переключение в режим Т32. Если бит 0 равен 0, выполня- 
ется переключение в режим АКМ. Бит 0 адресов инструкций всегда должен 
быть равен нулю из-за требований АКМ к выравниванию адресов. Это осво- 
бождает бит 0 для выбора набора инструкций. 


® 5х — переход по ссылке с выбором набора инструкций. Эта инструкция со- 
четает в себе функции инструкций 51 и ь№х. 


Режим супервизора 


С помощью этой инструкции код пользовательского режима может инициировать 
вызов режима супервизора. 


® °\с (вызов режима супервизора) — инициирование программного прерыва- 
ния, которое заставляет обработчик исключений режима супервизора обраба- 
тывать запрос на обслуживание системы. 


Контрольная точка 


Эта инструкция используется отладчиками при разработке программного обеспе- 
чения. 


» ЮКре (вызов контрольной точки). Эта инструкция использует 16-битный 
операнд, с помощью которого отладочное программное обеспечение может 
идентифицировать контрольную точку. 


Условное выполнение 


Многие инструкции АКМ поддерживают условное выполнение с использованием 
тех же кодов условий, что и в инструкциях ветвления. Если условие инструкции 
имеет значение "ложь", инструкция обрабатывается как пустая операция. Код усло- 
вия добавляется к обозначению инструкции. Этот механизм условного выполнения 
формально известен как предикация. 
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Например, эта функция преобразует полубайт (младшие 4 бита байта) в соответст- 
вующий его значению АЗСП-символ: 


// Преобразование младших 4 битов г@ В символ азслл 6 го 
п166]е2а$с11: 

апа ге, #0хЕ 

стр г@, #19 

ад4р1 го, ге, #(‘А' - 19) 

а4ат1 го, го, #'0' 


оу рс, 1Г 


Инструкция стр вычитает 1@ из полубайта в г@ и устанавливает флаг М, если го 
меньше 10. Если ге больше или равно 10, флаг М обнуляется. 


Если флаг № равен нулю, выполняется инструкция а4ар1 (р1 означает "плюс", 
т.е. "неотрицательный"), а инструкция аддт1 не выполняется. Если флаг М установ- 
лен, инструкция ад9р1 не выполняется, а инструкция ад4т1 выполняется. После за- 
вершения этой последовательности регистр г@ содержит символ в диапазоне 0-9 


или А-Е. 


Использование условного выполнения инструкций помогает поддерживать эффек- 
тивную работу конвейера инструкций, избегая ветвления. 


Другие категории инструкций 


Процессоры АЕМ в качестве опции поддерживают ряд инструкций $МО и инст- 
рукций для операций с плавающей запятой. Поддерживаются также дополнитель- 
ные инструкции, которые обычно используют только во время настройки системы. 


32-разрядный язык ассемблера АВМ 


Следующий пример на ассемблере АКМ использует синтаксис СМО Аз5зетЫег, по- 
ставляемого вместе с интегрированной средой разработки (песта{ед деуеортеп+ 
епутоптепь ГЕ) Апаго!4 Зато. Другие ассемблеры могут использовать иной син- 
таксис. Как и в случае с синтаксисом языков ассемблера п для х86 и хб4, поря- 
док операндов для большинства инструкций — сначала приемник, затем источник. 


Ниже приведен текст файла исходной программы пе110 на языке ассемблера АКМ: 


.ВехЕ 
.61оБа1 _$Фаге 


_$фаг*: 
ПОЮ го, #1 // ТЕ +а 1 ($%а0и*) 
1аг Гг1, =теззаве // соп5® уо1а *Би+ 
том г2, #соиПе —// 512е_ соуп* 


Юм г7, #4 // $у5са11 4 ($у$_ мге) 
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$\с 0 
ПО гд, #0 // 1пЕ $фажиз (0=0К) 
ОУ г7, #1 // $у$са11 1 (5у$_ех{) 
$\с 0 

„Дака 

теззаее: 
.а$с11 "Привет, архитектор компьютеров!" 

СОМПЕ = . - мезбаре 


Этот файл с именем ве11о_агт.5 транслируется и компонуется для получения ис- 
полняемого файла программы пе11о_агт с помощью следующих команд. Эти коман- 
ды используют средства разработки, поставляемые в пакете Апдго 4 5410 Майнуе 
Беуеортет Ки (МОК). Предполагается, что переменная среды У/Ш4о\$ РАТН 
включает в себя каталог со средствами разработки МОК. 


агт-11пих-апдго14еаб61-а$ -а]=Не1]0_агт.1$+ -о Пе]11о_агт.о пе11о_агт. $ 


агт-11пих-апаго14еа61-14 -о Пе1]о_агт Ве11о_агт.о 


Назначение компонентов этих команд: 


агт-14пих-апдго1деа61-аз — запускает ассемблер; 

-а1=Ие11о_агт.15+ — создает файл листинга с именем пе11о_агт.1$*; 
-о Не11о_агт.о — создает объектный файл с именем пе11о_агт.о; 
Ке11о_агт.$ — это имя исходного файла на языке ассемблера; 
агт-11пих-апаго14еа6б1-14 — запускает компоновщик; 

-о Ле11о_агт — создает объектный файл с именем 1е11о_агт; 


Ке11о_агт.о — это имя объектного файла, предоставляемого компоновщику в 
качестве входных данных. 


Ниже показана часть файла листинга пе11о_агт.1$+, сгенерированного этой коман- 
дой ассемблера: 


1 „ехе 

2 .5]оба1 _$Фаге 

3 

4 _$фаг*:; 

5 0000 ©100АОЕЗ Юм ге, #1 // 1пЕ а 1 ($%90ие) 

6 0004 14199ЕЕБ 14г г1, =Теззаре // соп$® мо14 *Би+ 

7 0008 1А20АФЕЗ [е Г2, #соипПЕ // $12е_+ соипе 

8 000с 0470АФЕЗ том г7, #4 // 5у$са11 4 (зуз_мгИе) 
9 0010 0000609 ЕЕ $УС [7 

10 


11 0014 ©00еАФЕЗ Ще го, #9 // 1 $Фафиз (0=0к) 
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12 0018 0170А@ЕЗ [168.7 г7, #1 // $у$са11 1 (зуз_ех1) 
13 001с 000000ЕЕ $\С 0 

14 

15 „Дака 

16 меззабе: 


17 0000 48656С6С .азс11 "Привет, архитектор компьютеров!" 


17 6Е2С2043 
17 62607075 
17 74657220 
17 41726368 
18 СОМПЕ = . - Меззаве 


Эту программу можно запустить на устройстве Апаго!4 с включенным режимом 
разработчика. Здесь мы не будем вдаваться в процедуру включения этого режима, 
но вы сможете получить необходимую информацию по этой теме с помощью поис- 
кав Интернете. 


Следующие строки отображаются при запуске этой программы на устройстве 
Апдго!4 с процессором АЕМ, подключенном к ПК с помощью ОЗВ-кабеля: 


С:\>а@б ризП Пе]1о0_агт /дафа/1оса1/%{тр/Пе]1о_агт 
С:\>а@6 $Пе]] сптоЯ +х /дафа/1оса1/&тр/Не11о_агт 


С:\>а4б $ве1] /дафа/1оса1/%тр/йе]1о_агт 


Привет, архитектор компьютеров! 


Эти команды используют инструмент Апдго!4 ОБефиг Ви@ее (адЪ), входящий в 
пакет Ап@го!4 3410. Программа |е11о_агт запускается на устройстве Апагола, од- 
нако выходные данные программы передаются на ПК и отображаются в окне ко- 
мандной строки. 


В следующем разделе представлена 64-разрядная архитектура АКМ, являющаяся 
расширением 32-разрядной архитектуры АКМ. 


Архитектура и набор инструкций 
64-разрядных процессоров АВМ 


О выходе 64-разрядной версии архитектуры АЕМ, названной ААгсй64, было объ- 
явлено в 2011 г. Она имеет тридцать один 64-разрядный регистр общего назначе- 
ния, 64-разрядную адресацию, 48-разрядное виртуальное адресное пространство и 
новый набор инструкций, названный А64. 

Набор 64-разрядных инструкций является надмножеством набора 32-разрядных 


инструкций, благодаря чему существующий 32-разрядный код может выполняться 
на 64-разрядных процессорах без изменений. 
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Инструкции имеют ширину 32 бита, а большинство операндов — 32 или 64 бита. 
Функции регистров А64 в некоторых отношениях отличаются от 32-разрядного ре- 
жима: программный счетчик больше не доступен напрямую в виде регистра, также 
предусмотрен дополнительный регистр, который всегда возвращает нулевое значе- 
ние операнда. 


На уровне привилегий пользователя большинство инструкций А64 имеют те же 
обозначения, что и соответствующие 32-разрядные инструкции. Ассемблер опреде- 
ляет, с какими данными работает инструкция — 64-разрядными или 32-разрядны- 
ми — на основе предоставленных операндов. Длину операнда и размер регистра, 
используемые инструкцией, определяют следующие правила: 


» имена 64-разрядных регистров начинаются с буквы х; например, хе; 
» имена 32-разрядных регистров начинаются с буквы м; например, м1; 


» 32-разрядные регистры занимают младшие 32 бита 64-разрядного регистра с 
соответствующим номером. 


При работе с 32-разрядными регистрами применяются следующие правила. 


» Операции с регистрами, такие как сдвиг вправо, выполняются так же, как ив 
32-разрядной архитектуре. 32-разрядный арифметический сдвиг вправо ис- 
пользует в качестве знакового бита бит 31, а не бит 63. 


» Коды условий для 32-разрядных операций устанавливаются на основе ре- 
зультата в младших 32 битах. 


» При записи в регистр \/ старшие 32 бита соответствующего регистра Х за- 
полняются нулями. 


А64 — это архитектура загрузки/сохранения с теми же названиями инструкций для 
операций с памятью (19г и $*г), что и для 32-разрядного режима. Существуют неко- 
торые различия и ограничения по сравнению с 32-разрядными инструкциями за- 
грузки и хранения. | 


» Базовый регистр должен быть регистром Х (64-разрядным). 


» Смещение адреса может быть задано теми же способами, что и в 32-разряд- 
ном режиме, а также в регистре Х. 32-разрядное смещение может быть до- 
полнено до 64 битов нулями или знаковыми битами. 


е В режимах индексной адресации в качестве смещения можно использовать 
только непосредственные значения. 


» В инструкциях 194т и $4т Аб4 не поддерживает загрузку и сохранение не- 
скольких регистров в одной инструкции. Вместо этого в Аб4 добавлены ин- 
струкции 14р и $+р для загрузки и сохранения нескольких регистров в одной 
инструкции. 


е Аб4 поддерживает условное выполнение только для небольшого подмноже- 
ства инструкций. 


Операции со стеком в Аб4 существенно отличаются. Возможно, самое болышое от- 
личие в этой области заключается в том, что при доступе к данным указатель стека 
должен сохранять 16-байтовое выравнивание. 
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64-разрядный язык ассемблера АКМ 


Ниже приведен текст файла исходной программы пе11о на 64-разрядном языке ас- 
семблера АКМ: 


.ФехЕ 
.6]оба] _$Каге 


$фаге: 
// Печать сообщения В файл 1 ($аоиф) с помощью системного Вызова 64 
ЮУ х@, #1 
1аг х1, =Т5Р 
ЮУ х2, #т5Е_1еп 
МОУ х8, #64 


// Выход из программы с помощью системного Вызова 93 с возвращением состояния @ 
МОМ хо, #0 
$\С К) 


„Дака 
И5В: 

.а$с11 "Привет, архитектор компьютеров!" 
т$р_1]еп = . - т5в 


Этот файл с именем пе11о_агтб4.5 транслируется и компонуется для получения ис- 
полняемого файла программы пе11о_агтб4 с помощью следующих команд. Эти ко- 
манды используют 64-разрядные средства разработки, поставляемые в пакете 
Апаго4 За4ю МОК. Их использование предполагает, что переменная среды 
\!1пдо\$ РАТН включает в себя каталог с необходимыми средствами. 


аагсп64-11пих-апдго14-а$ -а1=Ве1]о_агтб4.1$* -о Не11о_агтб4.о ^ Ве11о_агт64. $ 
аагср64-11пих-апдго14-14 -о Не110 агтб4 Пе1]о_агт64.о 


Назначение компонентов этих команд: 
® аагсиб4-11пих-апдго14-аз — запускает ассемблер; 
® -а1=1е11о_агтбА.15& — создает файл листинга с именем Ие11о_агтб4.1$*; 
® -0 1е11о агтбд.о — создает объектный файл с именем Не11о_агтб4.о; 
® [е110о_агтб4.5 — это имя исходного файла на языке ассемблера; 
® аагспб4-11пих-апаго14-14 — запускает компоновщик; 


® -0 Не!110о_агиб4 — создает исполняемый файл с именем пе11о_агт64; 
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® [е110о_агт64.о — это имя объектного файла, предоставляемого компоновщику 
в качестве входных данных. 


Ниже показана часть файла листинга пе11о_агт64.1$%, сгенерированного ассемблером. 


1 ‚ехе 

2 .510ба1 _$Таге 

3 

4 _$Фаг*: 

5 // Печать сообщения в файл 1 (5%4о0и*) с помощью системного 
вызова 64 

6 0000 20008602 тоу х@, #1 

7 0004 Е! 000058 14г хХ1, =т$в 

8 0008 42038002 МОУ х2, #т$в_1еп 

9 ееес 080886002 МЮ х8, #64 

10 0010 01000004 $\С 0 

11 

12 // Выход из программы с помощью системного вызова 93 с 
возвращением состояния @ 

13 0014 000086002 Мом хе, #0 

14 0018 А8@в8002` МЮ х8, #93 

15 001с 01000004 $\с 0 

16 
17 „Дата 
18 МсВ: 
19 0000 48656С6С .а$с11 "Привет, архитектор компьютеров!" 
19 622043 

19 65607075 

19 74657220 

19 41726368 

20 М$Е_1еп = . - 56 


Эту программу можно запустить на устройстве Апаго!А с включенным режимом 
разработчика, как было описано ранее. Следующие строки отображаются при за- 
пуске этой программы на устройстве Апаго!4 с процессором АКМ, подключенном 
к ПК с помощью ИЗВ-кабеля: 


С:\>а@б6 ризй Ве11о агтб4 /дафа/1оса1/тр/пе11о_агтб64 
С:\>а@б °Пе11 сИтоЯ +х /дафа/1оса1/%&тр/пе]1о_агтб4 


С:\>ааб зПе11 /дата/1оса1/&тр/Пе1То_агтб64 


Привет, архитектор компьютеров! 


На этом наше знакомство с 32-разрядной и 64-разрядной версиями архитектуры 
АКМ завершается. 
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Резюме 


После прочтения этой главы вы должны получить хорошее представление о высо- 
коуровневой организации и функциях регистров, наборов инструкций и языков ас- 
семблера архитектур х86, хб4 и АВМ (32-разрядной и 64-разрядной). 


Архитектуры х86 и хб4 в целом отражают СТЗС-подход к проектированию процессо- 
ров, используя инструкции разной длины, выполнение которых может занять много 
тактов, длинный конвейер и (в х86) ограниченное количество процессорных регистров. 


Архитектуры АКМ, с другой стороны, реализуют К!$С-подход с преимущественно 
однотактным выполнением инструкций, большим набором регистров и инструк- 
циями фиксированной длины (в известной степени). Ранние версии архитектуры 
АВМ имели конвейеры длиной всего в три этапа, хотя более в поздних поколениях 
число этапов значительно увеличено. 


Можно ли сказать, что одна из этих архитектур лучше другой в общем смысле? 
Каждая из них в чем-то может быть лучше другой, и разработчики систем должны 
выбирать архитектуру процессора, исходя из конкретных потребностей разрабаты- 
ваемой системы. Конечно, применению процессоров х86/х64 в персональных ком- 
пьютерах, компьютерах бизнес-класса и серверах свойственна значительная инер- 
ция. Аналогичным образом, доминирование процессоров АКМ в мобильных 
устройствах и встраиваемых системах имеет длинную историю. При выборе про- 
цессора для проектирования нового компьютера или мобильного устройства необ- 
ходимо учитывать множество факторов, помимо чистой производительности. 


В следующей главе мы рассмотрим архитектуру В1$С-У. Она была разработана с 
чистого листа, с учетом уроков, извлеченных из истории разработки процессоров, 
и без какого-либо багажа, требующего поддержки устаревших конструкций деся- 
тилетней давности. 


Упражнения 


1. Установите бесплатный выпуск \У15иа| Зи 1ю СоттипИу, доступный по адресу 
рб: //у15 ца] 5 би до. писгозо.сот/У$/соттипйу/, на ПК с ОС \Утдо\5. После 
завершения установки откройте среду разработки У151а1 За 1ю ШЕ и выберите 
из меню Тоой$ (Инструменты) пункт Се Тоо!5 ап@ Ееабигез... (Получить 
инструменты и возможности...). Установите рабочую нагрузку ОеКюр 
деу@ортепЕ И С++ (Разработка классических приложений на С++). 


В окне поиска \\Мт4до\$ на панели задач начните вводить Оеуе1орег Соттапа 
РгошрЕ +ог \№5 2022. Когда приложение появится в меню поиска, выберите его, 
чтобы открыть командную строку. 


Создайте файл с именем #е11о_х86.азт с содержимым, показанным в листинге 
исходного кода в разд. "Язык ассемблера х8б" этой главы. 


Выполните сборку программы, используя команду, приведенную в разд. "Язык 
ассемблера х8б" этой главы, и запустите ее. Убедитесь, что на экране отобра- 
жается строка: "Привет, архитектор компьютеров!". 
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2. Напишите на ассемблере х86б программу, которая вычисляет следующее 
выражение и выводит результат в виде шестнадцатеричного числа: [(129 — 66) х 
х (445 + 136)] : 3. В этой же программе создайте вызываемую функцию для 
печати одного байта в виде двух шестнадцатеричных цифр. 


3. В строке поиска \т9до\$ на панели задач начните вводить хб4 Маме Тоо1$ 
Соттап@ Рготре +ог №5 2022. Когда приложение появится в меню поиска, выберите 
его, чтобы открыть командную строку. 


Создайте файл с именем 1е11о_х64.азт с содержимым, показанным в листинге 
исходного кода в разд. "Язык ассемблера хб4" этой главы. 


Выполните сборку программы, используя команду, приведенную в разд. "Язык 
ассемблера" хб4 этой главы, и запустите ее. Убедитесь, что на экране отобра- 
жается строка: "Привет, архитектор компьютеров!". 


4. Напишите на ассемблере х64 программу, которая вычисляет следующее 
выражение и выводит результат в виде шестнадцатеричного числа: [(129 — 66) х 
х (445 + 136)] : 3. В этой же программе создайте вызываемую функцию для 
печати одного байта в виде двух шестнадцатеричных цифр. 


5. Установите бесплатный пакет Апаго!Ч ЗаФю ТОЕ, доступный по адресу 
№@р5://деуорег.ап4го!.сот/5и00/. После завершения установки откройте 
среду разработки Апдго1А ЗаЧ1юо ШЕ, создайте новый проект и выберите из 
меню Тоо!$ (Инструменты) пункт ЗОК Мапарег (Диспетчер ОК). Выберите 
вкладку ЗРК Тоо5 (Инструменты ОК) и установите флажок МОК, который 
может иметь обозначение МОК (514е Бу $14е). Завершите установку МОК. 


Найдите следующие файлы в каталоге установки ЗОК (местоположение по 
умолчанию: %1ОСАЕАРРОАТА\Апаго14) и добавьте эти каталоги в переменную среды 
РАТН: агт-11пих-апаго1деаб1-а$.ехе и а .ехе. Подсказка: следующая команда пред- 
назначена для конкретной версии Апдго14 5110 (ваш путь может отличаться): 


её РАТН=ХРАТНХ; ЖЕОСАГАРРОАТАЯ\Апаго1а\$ак\пак\23.0.7599858\+о0о]спа1п$5\11\т\ 
ргеби114\м1паом$-х86_64\Ы1п 


Создайте файл с именем 1е11о_агт.5 с содержимым, показанным в листинге ис- 
ходного кода в разд. "32-разрядный язык ассемблера АКМ" этой главы. 


Выполните сборку программы, используя команды, показанные в разд. "З32-раз- 
рядный язык ассемблера АКМ" этой главы. 


Включите режим разработчика на телефоне или планшете Апдго!19. Указания 
о том, как это сделать, можно найти в Интернете. 


Подсоедините Апдго!4-устройство к компьютеру с помощью ОЗВ-кабеля. 


Скопируйте исполняемый файл программы на телефон, используя команды, 
приведенные в разд. "32-разрядный язык ассемблера АКМ" этой главы, и за- 
пустите ее. Убедитесь, что на экране отображается строка: "Привет, архитектор 
компьютеров!". 


Отключите режим разработчика на телефоне или планшете Апдго14. 
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6. Напишите на 32-разрядном ассемблере АВМ программу, которая вычисляет 
следующее выражение и выводит результат в виде шестнадцатеричного числа: 
[(129 — 66) х (445 + 136)] : 3. В этой же программе создайте вызываемую 
функцию для печати одного байта в виде двух шестнадцатеричных цифр. 


7. Найдите следующие файлы в каталоге установки ЗОК (местоположение по 
умолчанию: %10ОСАГАРРОАТАЯ\Апаго14) и добавьте эти каталоги в переменную среды 
РАТН: аагсН64-11пих-апдго14-аз.ехе и а@б.ехе. Подсказка: следующая команда 
предназначена для конкретной версии Апд4го! З®Ч10 (ваш путь может 
отличаться): 


5еЕ РАТН=ХРАТН; Х-ОСАЕАРРОАТАЙ\Апаго1а\5акК\пак\23.0. 7599858 \Е00]спа1п$\11\мт\ 
ргеби1 14 \и1пдом$ -х86_64\61п;ЕОСАЕАРРОАТАЙ\Апаго1а\ ак\р1а{огт-+001$ 


Создайте файл с именем пе11о_агтбА.з с содержимым, показанным в листинге 
исходного кода в разд. "64-разрядный язык ассемблера АКМ" этой главы. 


Выполните сборку программы, используя команды, показанные в разд. "64-раз- 
рядный язык ассемблера АКМ" этой главы. 


Включите режим разработчика на телефоне или планшете Апдго!4. Подсоеди- 
ните Апдго14-устройство к компьютеру с помощью ЦЗВ-кабеля. 


Скопируйте исполняемый файл программы на телефон, используя команды, 
приведенные в разд. "64-разрядный язык ассемблера АКМ" этой главы, и за- 
пустите ее. Убедитесь, что на экране отображается строка: "Привет, архитектор 
компьютеров!". 


Отключите режим разработчика на телефоне или планшете Апдго14. 


8. Напишите на 64-разрядном ассемблере АКМ программу, которая вычисляет 
следующее выражение и выводит результат в виде шестнадцатеричного числа: 
[(129 — 66) х (445 + 136)] : 3. В этой же программе создайте вызываемую 
функцию для печати одного байта в виде двух шестнадцатеричных цифр. 
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Архитектура и набор 
инструкций К $С-\ 


В этой главе представлена относительно новая перспективная процессорная архи- 
тектура ВТЗС-У (произносится как "риск файв") с соответствующим набором инст- 
рукций. В1$С-У — это спецификация с полностью открытым исходным кодом для 
процессора с сокращенным набором инструкций. Были выпущены полные специ- 
фикации для набора инструкций пользовательского режима (непривилегирован- 
ных) и набора привилегированных инструкций, и в настоящее время доступно ши- 
рокое разнообразие аппаратных реализаций этой архитектуры. Также имеются 
спецификации ряда расширений набора инструкций для поддержки вычислений 
общего назначения, высокопроизводительных вычислений и встраиваемых реше- 
ний. Представленные на рынке процессоры реализуют многие из этих расширений. 


В этой главе будут рассмотрены следующие темы: 
» архитектура и приложения К!$С-У; 
» базовый набор инструкций ВГ$С-У; 
е расширения К1$С-У; 
» варианты ВТЗС-У; 
» 64-разрядная архитектура ВТЗС-У; 
» стандартные конфигурации В]$С-У; 
» язык ассемблера КТЗС-У; 


®е реализация концепции ВТ$С-У в ПЛИС (программируемая логическая инте- 
гральная схема — Не!4-ргоргтаттаЫе рае атау, ЕРСА). 


После прочтения этой главы вы будете обладать знаниями об архитектуре и воз- 
можностях процессора ВТЗС-У и предлагаемых отдельно расширений. 
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Вы ознакомитесь с основами набора инструкций КТЗС-У и поймете, как В1$С-У 
можно адаптировать для поддержки различных компьютерных архитектур — от 
недорогих встраиваемых систем до ферм облачных серверов размером с большой 
склад. Вы также узнаете, как реализовать процессор ВТ$С-У на недорогой плате 
ПЛИС. 


Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 
Вр: //2ВиБ.сот/РасКЕРиБИ$ В т?/Модегп-Сотрщег-АгспКес®иге-апд- 
Ограп17аНоп-Зесопд-Е 4! о0п. 


Архитектура и приложения В1$С-\У 


Архитектуру КТ$С-У, о выпуске которой было объявлено в 2014 г., разработали 
исследователи Калифорнийского университета в Беркли Юнсуп Ли (Уипзир Гее), 
Крсте Асанович (Кт%е Азапо\1с), Дэвид Э. Паттерсон (Рау\14 А. Равегзоп) и Эндрю 
Уотерман (Апаге\и \Маеппап). Эта работа последовала за четырьмя предыдущими 
крупными проектами архитектурных решений К1$С в Калифорнийском универси- 
тете в Беркли, поэтому она получила название ВГ$С-У, где У обозначает римскую 


цифру "пять". 
Проект ЕГЗС-У начинался с чистого листа с несколькими основными целями. 


»е Разработать архитектуру набора инструкций (шзфиасНоп её агсбИес@те, 
ЗА) ВТС, подходящую для широкого спектра областей применения — от 
мобильных устройств с минимальным энергопотреблением до высокопроиз- 
водительных многопроцессорных облачных серверов. 


» Предоставить [ЗА, которую может бесплатно использовать любой пользова- 
тель в любой области применения. Это контрастирует с [ЗА почти всех дру- 
гих доступных на рынке процессоров, являющихся тщательно охраняемой 
интеллектуальной собственностью компании, которой они принадлежат. 


» Учесть уроки, извлеченные на протяжении предыдущих десятилетий проек- 
тирования процессоров, избегая неправильных поворотов и неоптимальных 
функций, которые в других архитектурах приходится переносить в новые по- 
коления, чтобы поддерживать совместимость с предыдущими, иногда древ- 
ними с технологической точки зрения, поколениями. 


» Создать неболыную, но полнофункциональную базовую архитектуру, при- 
годную для применения в мобильных устройствах. Базовая [ЗА предоставля- 
ет минимальный набор возможностей, которые должны быть реализованы в 
любом процессоре В1$С-У. Базовая конфигурация ВТ$С-У — это 32-разряд- 
ный процессор с 31 регистром общего назначения. 


Все инструкции имеют длину 32 бита. Базовая [ЗА поддерживает сложение и 
вычитание целых чисел, но не включает в себя умножение и деление целых 
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чисел. Это позволяет избежать включения в минимальные реализации про- 
цессоров относительно дорогостоящих аппаратных средств умножения и де- 
ления для областей применения, где такие операции не требуются. 


»е Предоставить необязательные расширения 1ЗА для поддержки математики с 
плавающей запятой, неделимых операций в памяти, а также умножения и де- 
ления. 


» Предоставить дополнительные расширения 1ЗА для поддержки привилегиро- 
ванных режимов выполнения, аналогичных привилегированным реализациям 
х86, х64 и АКМ, обсуждавшимся в главе 10. 


» Обеспечить поддержку сжатого набора инструкций, реализующего 16-раз- 
рядные версии многих 32-разрядных инструкций. В процессорах, реализую- 
щих это расширение, 16-разрядные инструкции могут свободно чередоваться 
с 32-разрядными инструкциями. 


» Предоставить необязательные расширения !ЗА для поддержки 64-разрядных 
и даже 128-разрядных слов процессора и виртуальной памяти со страничной 
организацией на одноядерных и многоядерных процессорах, а также в мно- 
гопроцессорных конфигурациях. 


Сегодня процессоры ВТ$С-У доступны на рынке по конкурентоспособным ценам, 
поэтому, учитывая уровень развития архитектуры [ЗА и преимущества ее бесплат- 
ного использования, можно ожидать, что в ближайшие годы доля процессоров 
В!$С-У на рынке будет быстро расти. Доступны дистрибутивы В1ЗС-У для Глпах, 
которые включают в себя все средства разработки программного обеспечения, не- 
обходимые для создания и запуска приложений на компьютерах и мобильных уст- 
ройствах на базе ВТЗС-У. 


Некоторые области применения, где отмечается значительный рост популярности 
процессоров К1$С-\У: 


® искусственный интеллект и машинное обучение; 
» мобильные устройства; 

» вычисления экстремального масштаба; 

» вычисления со сверхнизким энергопотреблением; 
» периферийные вычисления в Интернете вещей. 


Мы рассмотрим некоторые реализации архитектуры К1$С-У для этих областей 
применения позже в этой главе. 


На рис. 11.1 представлен базовый набор регистров [ЗА В1ЗС-У. 


Регистры имеют ширину 32 бита. Регистры общего назначения от х1 до х31 можно 
использовать без каких-либо ограничений и без каких-либо специальных функций, 
назначенных аппаратными средствами процессора. Регистр хе аппаратно запро- 
граммирован на возврат нуля при считывании и отбрасывает любое записанное в 
него значение. Скоро мы увидим несколько интересных вариантов применения ре- 
гистра хе. 
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Рис. 11.1. Базовый набор регистров 15А Е/5С-У 


Каждый регистр имеет одно или два альтернативных имени, показанных на рис. 11.1. 
Эти имена соответствуют использованию регистров в стандартном двоичном 
интерфейсе прикладных программ (аррПсаНоп БМпагу ицегЁсе, АВТ) КТ5С-У. 
АВ] необходим, т. к. регистры х1—хз1 являются функционально взаимозаменяемы- 
ми, а для совместимости программного обеспечения требуется, чтобы мы указали, 
какой регистр должен служить указателем стека, какие регистры должны содер- 
жать аргументы функций, возвращаемые значения, и т. д. Обозначения регистров: 


га — адрес возврата функции; 

5р — указатель стека; 

вр — глобальный указатель данных; 

{р — локальный указатель данных (на уровне потока); 
+е—+6 — временное хранение; 


+р — указатель кадра для данных локального стека (на уровне функции) (этот 
вариант использования не является обязательным); 


50-511 — сохраняемые регистры (если указатель кадра не используется, 
х8 становится $6); 

а@-а7 — аргументы, передаваемые в функции. Любые дополнительные аргу- 
менты передаются в стек. Возвращаемые функцией значения передаются в а@ 
И а1. 
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Регистр рс содержит 32-разрядный программный счетчик, содержащий адрес теку- 
щей инструкции. 


Вас может удивить тот факт, что в [ЗА К!ЗС-У отсутствуют флаги процессора. Не- 
которые операции, которые изменяют флаги в других процессорных архитектурах, 
в ВГЭС-У сохраняют результаты в регистре. Например, инструкции К1$С-У для 
знакового ($1+) и беззнакового ($144) сравнения выполняют вычитание одного опе- 
ранда из другого и устанавливают в регистре-приемнике значение @ или 1 в зависи- 
мости от знака результата. Последующая инструкция условного ветвления может 
использовать значение в этом регистре, чтобы определить, какой путь выполнения 
кода выбрать. 


Некоторые флаги, используемые в других процессорах, в ВГЗС-У необходимо вы- 
числять. Например, здесь нет флага переноса. Для того чтобы определить, привело 
ли сложение к переносу, нужно сравнить сумму и один из операндов инструкции 
сложения. Если эта сумма больше или равна слагаемому (для сравнения можно ис- 
пользовать любое слагаемое), переноса не было, в противном случае сложение по- 
родило перенос. 


В большинстве базовых вычислительных инструкций [ЗА используется формат с 
тремя операндами, где первый операнд является регистром-приемником, второй 
операнд — регистром-источником, а третий операнд представляет собой либо ре- 
гистр-источник, либо непосредственное значение. Вот пример инструкции с тремя 
операндами: 


ада х1, х2, х3З 


Эта инструкция добавляет содержимое регистра х2 к содержимому регистра хз и 
сохраняет результат в регистре х1. 


Для того чтобы избежать введения инструкций, которые не являются строго необ- 
ходимыми, многим инструкциям назначены дополнительные функции, которые в 
других процессорных архитектурах выполняются отдельными инструкциями. На- 
пример, в ВЗС-У отсутствует инструкция, которая просто перемещает содержимое 
одного регистра в другой. Вместо этого инструкция сложения в В$С-У складывает 
значение из регистра-источника и непосредственное значение, равное нулю, и со- 
храняет результат в регистре-приемнике, получая тот же результат. Таким образом, 
инструкция для перемещения содержимого регистра х2 в регистр х1 выглядит так: 
ада х1,х2,0 — она помещает значение (х2 + 0) в регистр х1. 


Язык ассемблера ВТЗС-У предоставляет несколько псевдоинструкций, использую- 
щих знакомую терминологию для реализации таких функций. Например, ассемблер 
переводит псевдоинструкцию пм х1,х2 в буквальную инструкцию ада х1,х2,0. 


Базовый набор инструкций В!$С-У 


Базовый набор инструкций ВГЗС-У состоит всего из 47 инструкций. Восемь из 
них — это системные инструкции, которые выполняют системные вызовы и полу- 
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чают доступ к счетчикам производительности. Остальные 39 инструкций относятся 
к категориям вычислительных инструкций, инструкций потока управления и инст- 
рукций доступа к памяти. Мы рассмотрим каждую из этих категорий по очереди. 


Вычислительные инструкции 


Все вычислительные инструкции, кроме 1и1 и аи1рс, используют формат с тремя 
операндами. Первый операнд — это регистр-приемник, второй — регистр-источ- 
ник, а третий — либо второй регистр-источник, либо непосредственное значение. 
Обозначения инструкций, использующих непосредственное значение (за исключе- 
НИем аи1рс), заканчиваются буквой 1. Вот эти инструкции и их функции. 


® а04, а441, зи6 — сложение и вычитание. Непосредственное значение в инст- 
рукции а@91 — это 12-битное значение со знаком. Инструкция зи6 вычитает 
второй операнд-источник из первого. Инструкция зиб1 отсутствует, т. к. адв1 
можно использовать для добавления отрицательного непосредственного зна- 
чения. 


® 511, $111, $Г1, $г11, °га, °га1 — логический сдвиг влево и вправо ($11 и $г1) и 
арифметический сдвиг вправо (га). При выполнении логического сдвига в 
освободившиеся битовые позиции вставляются нули. При арифметическом 
сдвиге вправо в освободившихся позициях повторяется бит знака. Количест- 
во битовых позиций для сдвига берется из младших 5 бит второго регистра- 
источника или из 5-битного непосредственного значения. 


® аП4, апа1, ог, ог1, хог, хог1 — выполнение указанной побитовой операции над 
двумя операндами-источниками. Непосредственные значения, используемые 
в качестве операндов, имеют ширину 12 бит. 


® $14, $141, $14, $14и1 — инструкции 5е1 | Гез5 Трап (установить, если меньше, 
чем) устанавливают в регистре-приемнике значение 1, если первый операнд- 
источник меньше, чем второй операнд-источник. Это сравнение выполняется 
в дополнительном коде ($1*) или для беззнаковых операндов ($1+и). В качест- 
ве операндов используются 12-битные непосредственные значения. 


® 1и1 — загрузка непосредственного значения в старшие биты. Эта инструкция 
загружает в биты 12-31 регистра-приемника 20-битное непосредственное 
значение. Для записи в регистр произвольного 32-разрядного непосредствен- 
ного значения требуются две инструкции: сначала 1и1 устанавливает в битах 
12-31 старшие 20 битов значения, затем ада1 добавляет младшие 12 битов для 
получения полного 32-разрядного итогового значения. 1и1 имеет два операн- 
да: регистр-приемник и непосредственное значение. 


® аи1рс — добавление непосредственного значения из старших битов к значе- 
нию программного счетчика и сохранение результата в регистре-приемнике. 
Эта инструкция добавляет 20-битное непосредственное значение к старшим 
20 битам программного счетчика (ПС). В К1$С-У эта инструкция реализует 
адресацию относительно значения ПС. 


Для получения полного 32-разрядного адреса относительно ПС аиёрс форми- 
рует частичный результат, после чего инструкция ааа! добавляет младшие 12 бит. 
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Инструкции потока управления 


Инструкции условного ветвления выполняют сравнение двух регистров и на осно- 
вании результата могут передавать управление в пределах диапазона, задаваемого 
знаковым 12-битным смещением адреса относительно текущего значения ПС. Пре- 
дусмотрены две инструкции безусловного перехода, одна из которых (3а1г) обеспе- 
чивает доступ ко всему 32-разрядному диапазону адресов. 


® ред, пе, 51%, Б1Хи, Бве, Бвеи — переход при следующих условиях: равно (ъед), не 
равно (ьпе), меньше чем (514), меньше чем без знака (51%и), больше или равно 
(ве), больше или равно без знака (5вец). Эти инструкции выполняют указан- 
ное сравнение между двумя регистрами и, если условие выполнено, передают 
управление по адресу со смещением, заданным непосредственным 12-бит- 
ным значением со знаком. 


»® ]а1 — переход и связывание. Передача управления по адресу со смещением 
относительно ПС, заданного 20-битным непосредственным значением со зна- 
ком, и сохранение адреса следующей инструкции (адрес возврата) в регистре- 
приемнике. 


» ]а1г — переход, связывание и регистр. Вычисляет целевой адрес как сумму 
регистра-источника и знакового 12-битного непосредственного значения, за- 
тем выполняет переход по этому адресу и сохраняет адрес следующей инст- 
рукции в регистре-приемнике. Когда ей предшествует аи1рс, инструкция 3а1г 
может выполнить переход относительно ПС в любое место 32-битного ад- 
ресного пространства. 


Инструкции доступа к памяти 


Инструкции доступа к памяти перемещают данные между регистром и ячейкой па- 
мяти. Первый операнд — это регистр, в который требуется загрузить значение или 
содержимое которого следует сохранить. Второй операнд — регистр, содержащий 
адрес в памяти. К адресу в регистре добавляется 12-битное непосредственное зна- 
чение со знаком для получения конечного адреса, используемого для загрузки или 
сохранения. 


Инструкции загрузки выполняют расширение знака для знаковых значений или до- 
полнение нулями для беззнаковых значений. При загрузке значения данных мень- 
шего размера (байта или полуслова) операция расширения знака или дополнения 
нулями обеспечивает заполнение остальных 32 битов в регистре-приемнике. 


На работу с беззнаковыми значениями в обозначении инструкции указывает завер- 
шающий символ и. 


е 16, 1, 11, 1, 1м— загрузка в регистр-приемник 8-битного байта (15), 
16-битного полуслова (1/) или 32-битного слова (1м). При загрузке байтов и 
полуслов инструкции либо распространяют знак (16 и 11), либо дополняют 
нулями (1 и 1пи) остальные биты 32-битного регистра-приемника. 


Например, инструкция 1м х1, 16(х2) загружает слово по адресу (х2 + 16) в ре- 
гистр х1. 
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® 55, $1, зи — сохранение байта ($5), полуслова ($1) или слова (5м) в область па- 
мяти, соответствующую размеру значения данных. 


»® +епсе — упорядочение доступа к памяти в многопоточном контексте. Цель 
этой инструкции — обеспечить согласованное представление кешированных 
данных в разных потоках. Она принимает два операнда: первый определяет 
типы предыдущих операций обращения к памяти, которые должны завер- 
шиться до выполнения инструкции +епсе, второй — типы последующих опе- 
раций обращения к памяти, выполнение которых ограничивает инструкция 
+епсе. Типы операций, упорядочиваемых этой инструкцией, — чтение из па- 
мяти и запись в память (г им), а также ввод и вывод через устройства ввода- 
вывода (1 и о). Например, инструкция +епсе ги, ги гарантирует, что все опе- 
рации чтения и записи с использованием адресов памяти, начатые до инст- 
рукции +епсе, завершатся до начала любых последующих операций чтения из 
памяти или записи в память. Эта инструкция гарантирует, что любые значе- 
ния, находящиеся в блоках кеш-памяти процессора, надлежащим образом 
синхронизированы с памятью или устройством ввода-вывода. 


® епсе.1 — инструкция гарантирует, что все операции сохранения в памяти 
инструкций будут завершены до выполнения инструкции +епсе.1. Данная ин- 
струкция в основном полезна в контексте самомодифицирующегося кода. 


Системные инструкции 


Из восьми системных инструкций одна выполняет системный вызов, одна устанав- 
ливает контрольную точку для отладчика, а остальные шесть считывают и записы- 
вают данные в регистры управления и состояния (сопо] апд %байа$ герлегз, СЗК) 
системы. Инструкции манипулирования регистрами СЗК считывают текущее зна- 
чение выбранного СЗК в регистр, затем обновляют СЗВ, записывая новое значение, 
обнуляя или устанавливая выбранные биты. Исходное значение для модификации 
СЪК предоставляется в регистре или в виде 5-битного непосредственного значения. 
Для идентификации СЗЁ используется 12-битный адрес. Каждая инструкция СЗК 
выполняет чтение и запись СЗК как неделимую операцию. 


® еса11 — выполнение системного вызова. Регистры, используемые для переда- 
чи параметров в вызов и возврата из него, определяются с помощью интер- 
фейса АВГ, а не аппаратными средствами процессора. 


® ебгеак — установка контрольной точки отладчика. 


®  С5ГГИ, СУГГИ1, С5ГГС, С$ГГС1, С$ГГ$, С$ГГ$1 — СсЧИТЫыВание содержимого указанно- 
го регистра СВ в регистр-приемник и запись в него значения операнда- 
источника (сзгги), обнуление в регистре-приемнике битов, имеющих значе- 
ние | в операнде-источнике (с$ггс), либо установка в регистре-приемнике би- 
тов, имеющих значение 1 бита в операнде-источнике (сзгг$). 


Эти инструкции принимают три операнда: первый — регистр-приемник, куда 
помещается значение, считанное из СЗК, второй — адрес СЗК, третий — ре- 
гистр-источник или 5-битное непосредственное значение (суффикс 1). 
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В базовой архитектуре ВТЗС-У определены шесть регистров СЗВ, которые доступ- 
ны только для чтения. Для того чтобы выполнить любую из инструкций доступа к 
СК в режиме только для чтения, в качестве третьего операнда необходимо указать 
регистр хе. 


Следующие регистры определяют три 64-битных счетчика производительности. 


® сус1е, сус1ен — младшие (сус1е) и старшие (сус1ев) 32 бита 64-битного счетчи- 
ка системных тактов, прошедших с начала отсчета времени — как правило, 
с момента запуска системы. Частота системного тактового сигнала может ме- 
няться, если включена функция динамического изменения напряжения и 
частоты (дупаптс уо{аре Яедиепсу зсайп?, РУЕ$). 


» Ч1те, тер — младшие (+1те) и старшие (+1те!) 32 бита 64-битного счетчика 
тактов часов реального времени с фиксированной частотой, прошедших с на- 
чала отсчета времени — как правило, с момента запуска системы. 


® Зп5фгефь, 1п54геи — младшие (1п54геф) и старшие (1п$%гефи) 32 бита 64-битного 
счетчика выполненных инструкций процессора. Выполненные инструкции — 
это те, выполнение которых завершено. 


Обе 32-битные половины каждого счетчика производительности нельзя прочитать с 
помощью одной неделимой операции. Для предотвращения ошибок и надежного 
считывания показаний каждого из 64-битных счетчиков необходимо использовать 


следующую процедуру: 
1. Считывание старших 32 бит счетчика в регистр. 


2. Считывание младших 32 бит счетчика в другой регистр. 
3. Считывание старших 32 бит счетчика в третий регистр. 
4 


Сравнение результатов первого и второго считывания старших 32 бит счетчика. 
Если они отличаются, возврат к шагу Г[. 


Эта процедура приведет к считыванию действительного значения счетчика, даже 
если счетчик продолжает работать между моментами считывания. Обычно для вы- 
полнения этой последовательности требуется, самое большее, один обратный пере- 
ход к шагу 4. 


Псевдоинструкции 


Архитектура ВТЗС-У имеет сокращенный набор инструкций, в котором отсутству- 
ют инструкции нескольких типов, включенных в наборы инструкций, которые мы 
исследовали в предыдущих главах. Функции многих из этих уже знакомых инст- 
рукций могут быть выполнены с помощью инструкций ВЕЗС-У, хотя, возможно, не 
всегда интуитивно понятным образом. 


Ассемблер К1ЗС-У поддерживает несколько псевдоинструкций, каждая из которых 
преобразуется в одну или несколько инструкций В1Т$С-У, обеспечивающих функ- 
циональность, предположительно ожидаемую в наборе инструкций процессора об- 
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щего назначения. В табл. 11.] представлено несколько наиболее полезных псевдо- 
инструкций ВТ$С-У. 


Таблица 11.1. Псевдоинструкции К!5С-У 


о рощи | 


МУ Га, г$ а441 га, г5, 9 Копирование г$ в га 


по га, г$ хог1 га, г$, -1 Га = №Т г$ 


пер г, г5 546 га, х@, г$ Га = -г5 


] оЕЕе* )а1 х@, о|Езе{ Безусловный переход 


)а1 оЕРзее )а1 х1, оррхее Ближний вызов функции 


(20-битное смещение) 


са11 оЕбее аи1рс х1, о+Рсее [31:12] + оЁжее [11] Дальний вызов функции 


3а1г х1, озеф [11:0] (х1) (32-битное смещение) 


ге да1^ х@, @ (х1) Возврат из функции 


Бед2 г$, оЕзее Бед г$, х@, о++етф Переход, если равно нулю 


Бвет г$, ое* Бве гх, х@, оеф. Переход, если больше или 


равно нулю 


147 г$, ге, ое 61+ г$, хо, оЕРсее Переход, если меньше нуля 


БЕЕ г5, ГЕ, оРжет БЕ гЕ, г$, оЕРбе* 


Переход, если больше 


Ь]е г$, ге, о ее Бве ге, г5, оЕР5е* Переход, если меньше или 


равно 


фепсе фепсе 1огм, 1оги Выравнивание всех опера- 


ций обращения к памяти и 


операций ввода-вывода че- 


рез память 


С5ГГ Г, С5Г сэгги га, сзг, х@ Считывание регистра СК 
11 га, итед аа41 га, хо, 1ттед Загрузка 12-битного непо- 
средственного значения 

11 га, итеа 11 га, иттед [31:12] + иттеа [11] Загрузка 32-битного непо- 
а9491 га, хе, 1ттеа [11:0] средственного значения 

1а га, зутбо1 аи1рс га, де1%а [31:12] + ае1*а [11] Загрузка адреса $утбо1, где 
ад41 га, га, де]а [11:0] де1а=(5утбо1-рс) 

]1м га, $утбо1 аи1рс га, ае]Жа [31:12] + ае1{а [11] Загрузка слова по адресу 
1м га, га, ае1%а [11:0] (га) 5утбо1, где ае1*а=($утбо1-рс) 

5м га, $утбо1, г+ аи1рс ге, ае1*а [31:12] + ае1Жа [11] Сохранение слова по адресу 
м га, га, ае1Жа [11:0] (г+*) 5утбо]1, где де14а=(5утбо1-рс) 
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В табл. 11.1: га — регистр-приемник, г — регистр-источник, с$г — регистр управ- 
ления и состояния, зутьо1 — абсолютный адрес данных, ое — адрес инструкции 
относительно ПС. 


Инструкции, объединяющие старшие 20 бит адреса или непосредственного значения 
с непосредственным значением, содержащим младшие 12 бит, должны выполнять 
шаг, обратный эффекту расширения знака бита 11 младшего 12-битного значения 
во второй инструкции каждой последовательности. Это необходимо, т. к. непосред- 
ственное значение в инструкции ада1 всегда рассматривается как значение со зна- 
ком. Перед добавлением 12-битного непосредственного значения к старшим 20 би- 
там выполняется распространение старшего бита этого значения до бита 31. 


Следующий пример демонстрирует эту проблему и ее решение. Предположим, что 


требуется загрузить значение @хЕЕЕЕЕЕЕЕ в регистр с помощью инструкций 1и1 и ада1, 
и просто сложим старшую и младшую части, как показано здесь: 


1\1 х1, ОхЕРЕЕЕ # х1 теперь равно @хЕЕЕЕЕО00 
а491 х1, х1, @хЕЕЕ 


и ует отметит один момент, кабающийся: кода ‘ассемблера в этой 
(7 ‘главе: в. ассемблере В15С-У начало комментария обозначается симво- 
лом #. Е. | 


Инструкция ад41 выполняет распространение знакового разряда в @хЕЕЕ до @хЕЕЕЕЕЕЕЕ 
перед добавлением к ехЕЕЕЕЕеее. Результатом сложения будет @хЕЕЕЕЕЕЕЕ, а это не то, 
что мы хотим получить. Добавление бита 11 из младших 12 бит к старшим 20 би- 
там исправит это, как показано в следующем блоке кода: 


141 х1, @хРЕЕЕЕ+1 # Добавим бит 11; х1 теперь равен @хоеееееео 
а441 х1, х1, ОхЕРЕ 


Теперь результат равен ехЕЕЕЕЕЕЕЕ, что является правильным значением. Эта проце- 
дура будет работать и для любого другого числового значения. Если бит 11 окажет- 
ся равным 0, то к старшим 20 битам ничего добавлено не будет. 


Уровни привилегий 
В архитектуре КТ$С-У определены три уровня привилегий, на которых может ра- 
ботать поток: 

» пользователь (Ц); 

е супервизор ($); 


® машина (М). 
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Все реализации К!ЗС-У должны поддерживать режим М — наиболее привилегиро- 
ванный уровень, который предоставляет доступ ко всем функциям системы. Этот 
режим активен после перезагрузки системы. Код в простой встраиваемой системе 
может полностью выполняться в режиме м. 


В несколько более сложном случае процесс безопасной загрузки может выполнять- 
ся на уровне привилегий М, загружая, проверяя и запуская приложение, которое вы- 
полняется в режиме Ц. Такой подход позволяет построить безопасное встраиваемое 
решение. 


В дополнение к обязательному уровню М процессор ВГЗС-У может поддерживать 
уровень Ч или оба уровня — $ и ц. Система, работающая под управлением операци- 
онной системы общего назначения, использует режим $ и режим Ц так же, как ре- 
жимы ядра и пользователя процессоров и операционных систем, рассмотренных в 
предыдущих главах. 


В Е$С-У приложения, работающие в режиме ц, запрашивают системные сервисы с 
помощью инструкции еса11 (вызов среды исполнения), генерирующей исключение, 
обрабатываемое на уровне $. Структура привилегий ВТ$С-У напрямую поддержи- 
вает современные операционные системы, такие как 1лпих. 


На каждом из трех уровней привилегий определены отдельные наборы регистров 
СК для настройки конфигурации, управления и мониторинга системы. В зависи- 
мости от уровня привилегий запущенного потока и уровня СЪК, поток может иметь 
доступ к СЪК в режиме чтения-записи или только чтения либо не иметь доступа. 
Потоки на более высоких уровнях привилегий могут получить доступ к СЗЁВ на 6бо- 
лее низких уровнях привилегий. 


На уровне привилегий $ в К!$С-У поддерживается виртуальная память со странич- 
ной организацией с 32-битным адресным пространством, разделенным на страницы 
по 4 Кбайт. 32-битный виртуальный адрес разделен на 20-битный номер виртуаль- 
ной страницы и 12-битное смещение страницы. 


Для 64-разрядной среды К$С-У определены две дополнительные конфигурации 
виртуальной памяти. Первая использует 39-битное адресное пространство, поддер- 
живающее 512 Гбайт виртуальной памяти. 


Для приложений, требующих еще большего числа виртуальных адресов, доступно 
48-битное адресное пространство, предоставляющее доступ к 256 Тбайт виртуальной 
памяти. 48-битная конфигурация предлагает гораздо больше памяти, чем 39-битная, 
однако она также требует дополнительного объема памяти для хранения таблиц 
страниц, а обработка этих таблиц занимает больше времени. 


Следующие инструкции поддерживают привилегированные уровни выполнения. 


» тгеф, згеф, игеё — возврат из обработчика исключений, инициированного ин- 
струкцией еса11. Каждая из этих инструкций может быть выполнена на уров- 
не привилегий, обозначенном первой буквой в их названиях, или на более 
высоком. Выполнение одной из этих инструкций для уровня привилегий ни- 
же, чем у текущего потока, приведет к возврату из исключения, иницииро- 
ванного на более низком уровне. 
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» {1 — ожидание прерывания. Эта инструкция запрашивает приостановку те- 
кущего потока до тех пор, пока не появится прерывание, требующее обслу- 
живания. Спецификация К$С-У требует, чтобы эта инструкция служила 
только подсказкой, поэтому в конкретной реализации инструкция мЁ1 может 
обрабатываться как пустая и не приводить к приостановке потока. Поскольку 
процессор может обрабатывать м+1 как пустую операцию, код, следующий за 
инструкцией иЁ1, должен явно проверять наличие ожидающих прерываний, 
нуждающихся в обработке. Эта последовательность обычно возникает внутри 
цикла. 


® °{епсе.мта — сброс данных таблиц страниц виртуальной памяти из кеша в па- 
мять. Буква $ в начале обозначения инструкции указывает на то, что она 
предназначена для использования на уровне привилегий супервизора. 


ВГЗС-У определяет дополнительные инструкции и регистры СЗВ, поддерживаю- 
щие виртуализацию и гипервизор, управляющий виртуальной средой. Виртуализа- 
ция К]$С-У будет рассмотрена в главе 12. 


Расширения В1$С-У 


Описанный выше набор инструкций называется ВУЗ2Т (В1$С-У 32-51 [щерег 
шугисНоп 5е(), что расшифровывается как набор инструкций ВТ$С-У для 32-раз- 
рядных целых чисел. Архитектура набора инструкций КУЗ21 предоставляет пол- 
ный и практичный набор инструкций для многих целей, однако в нем отсутствует 
ряд функций и возможностей, доступных в других популярных процессорах, таких 
как х86 и АВМ. 


Для поэтапного добавления возможностей к базовому набору инструкций с учетом 
требований совместимости в архитектуре ВГ$С-У предусмотрены расширения. Раз- 
работчики процессоров В1$С-У могут выборочно включать расширения в свои 
проекты, чтобы добиться оптимального соотношения между размером микросхе- 
мы, возможностями системы и производительностью. 


Такие же гибкие возможности проектирования доступны и разработчикам недоро- 
гих систем на базе ПЛИС. Подробнее о реализации процессора ВТЗС-У на основе 
ПЛИС мы поговорим позже в этой главе. Основные расширения, которые мы рас- 
смотрим, получили названия в виде букв М, А, С, Еи о. Мы также упомянем некото- 
рые другие доступные расширения. 


Расширение М 


Расширение М архитектуры В1$С-У добавляет к базовому набору инструкций К\УЗ21 
функции целочисленного умножения и деления. В состав этого расширения вклю- 
чены следующие инструкции. 


» т] — перемножение двух 32-битных регистров и сохранение младших 
32 бит результата в регистре-приемнике. 
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® ШлЬ, тли, пи1Изи — перемножение двух 32-битных регистров и сохранение 
старших 32 бит результата в регистре-приемнике. В этих инструкциях мно- 
жители рассматриваются как оба со знаком (ти1п), оба без знака (ти1пи) или 
как г$1 со знаком и г52 без знака (ми1изи). г51 — это первый регистр-источник 
инструкции, а г52 — второй. 


® 41\, 41\уи — деление двух 32-битных регистров и округление результата в на- 
правлении нуля с использованием знаковых (91%) или беззнаковых (41\и) опе- 
рандов. 


® гет, гети — возвращение остатка от деления, выполненного с помощью инст- 
рукции а1м или 91ми. 


Деление на ноль не вызывает выдачу исключения. Для того чтобы обнаружить де- 
ление на ноль, код должен проверить делитель и перейти к соответствующему об- 
работчику, если делитель равен нулю. 


Расширение А 


Расширение А набора инструкций ВТ$С-У содержит неделимые операции чтения- 
изменения-записи для поддержки многопоточной обработки в общей памяти. 


Инструкции загрузки с резервированием (1г.м) и сохранения с условием ($с.м) ра- 
ботают в паре, выполняя чтение ячейки памяти, после чего следует запись в ту же 
ячейку в неделимой последовательности. Инструкция загрузки с резервированием 
резервирует адрес памяти во время загрузки. Если во время действия этого резер- 
вирования другой поток записывает данные в ту же ячейку, резервирование отме- 
няется. 


Инструкция сохранения с условием возвращает значение, показывающее, насколь- 
ко успешным было выполнение неделимой операции. Если резервирование сохра- 
няет действие (другими словами, если по целевому адресу не было промежуточной 
записи), инструкция сохранения с условием записывает содержимое регистра в па- 
мять и возвращает ноль, указывая на успешное выполнение. 


Если резервирование было отменено, инструкция сохранения с условием не изме- 
няет содержимое ячейки памяти и возвращает ненулевое значение, указывающее на 
неудачу операции сохранения. Операции загрузки с резервированием и сохранения 
с условием реализуют следующие инструкции. 


® 1г.м — загрузка в регистр данных из ячейки памяти и резервирование этой 
ячейки. 


® 5с.м — условное сохранение содержимого регистра в ячейку памяти. Инструк- 
ция записывает ноль в регистр-приемник, если операция прошла успешно и за- 
пись в ячейку памяти была выполнена, или помещает в этот регистр ненулевое 
значение, если резервирование ячейки было отменено. Если резервирование 
было отменено, эта инструкция не изменяет содержимое ячейки памяти. 


Инструкции неделимых операций в памяти (атс тетогу ореганоп, АМО) 
в неделимой последовательности загружают слово из ячейки памяти в регистр- 
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приемник, выполняют двоичную операцию между загруженным значением и гз2, 
после чего сохраняют результат в памяти по адресу данной ячейки. Операции АМО 
реализуют следующие инструкции. 


е атозиар.м — неделимый обмен значениями между гз2 и ячейкой памяти гз1. 
® атоада.м — неделимое добавление гз2 к ячейке памяти г$1. 


® атоап4д.м, атоюог.м, атохог.м — выполнение неделимых операций И, ИЛИ и "ис- 
ключающее ИЛИ" над содержимым регистра г$2 с записью результата в 
ячейку памяти г$1. 


® атотп.м, атот1пи.м, атотах.м, апотахи.м — выполнение неделимых операций вы- 
бора минимального или максимального знакового или беззнакового (инст- 
рукции с суффиксом и) значений над г52 с записью результата в ячейку памя- 
ТИ Г$1. 


Расширение С 


Расширение С набора инструкций ВТ$С-У реализует сжатые инструкции с целью 
свести к минимуму объем памяти для хранения инструкций и уменьшить трафик по 
шине, требуемый для извлечения инструкций. 


Все рассмотренные ранее инструкции КУЗ2 имеют длину 32 бита. Расширение с 
предлагает альтернативные 16-разрядные представления многих наиболее часто 
используемых инструкций КУЗ2[. Каждая сжатая инструкция эквивалентна одной 
полноразмерной инструкции. Переключение режимов не требуется, и это означает, 
что в программах можно свободно смешивать 32-разрядные инструкции ВУЗ21 и 
сжатые 16-разрядные инструкции. 


На самом деле программистам на ассемблере даже не нужно предпринимать какие- 
либо действия, чтобы указать, следует ли генерировать инструкцию в сжатом виде. 
Ассемблер и компоновщик способны прозрачно выдавать сжатые инструкции для 
уменьшения размера кода, где это возможно, и в большинстве случаев — без сни- 
жения производительности выполнения программ. 


При работе с процессорами и наборами инструментов разработки программного 
обеспечения, поддерживающими расширение с В$С-У, преимущества сжатых ин- 
струкций сразу же становятся доступны разработчикам, использующим язык ас- 
семблера, а также тем, кто работает с языками более высокого уровня. 


Расширения Ги) 


Расширения Е и 0 набора инструкций В1$С-У обеспечивают аппаратную поддержку 
арифметики с плавающей запятой одинарной точности (Е) и двойной точности (0) 
в соответствии со стандартом ТЕЕЕ 754. Расширение Е добавляет в архитектуру 
32 регистра с плавающей запятой от +9 до +31 и регистр управления и состояния с 
именем +сзг. Все эти регистры имеют разрядность 32 бита. Это расширение вклю- 
чает в себя набор инструкций с плавающей запятой, которые соответствуют опре- 
делениям одинарной точности в стандарте ГЕЕЕЁ 754-2008. 
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Большинство инструкций с плавающей запятой работают с регистрами с плаваю- 
щей запятой. В этом расширении реализованы инструкции передачи данных для 
загрузки данных из памяти в регистры с плавающей запятой, сохранения содержи- 
мого регистров с плавающей запятой в памяти и перемещения данных между реги- 
страми с плавающей запятой и регистрами целых чисел. 


Расширение о увеличивает разрядность регистров +@-—+31 до 64 битов. В этой конфи- 
гурации каждый регистр + может содержать 32- или 64-битное значение. Добавле- 
ны инструкции с плавающей запятой, соответствующие определениям двойной 
точности в стандарте ТЕЕЕ 754-2008. Расширение о требует наличия расширения Е. 


Другие расширения 


В следующем списке приведены описания ряда дополнительных расширений архи- 
тектуры ВТЗС-У, которые уже определены, находятся в разработке или, по крайней 
мере, рассматриваются для будущей разработки. 


е Архитектура КУЗ2Е. На самом деле это не расширение, а скорее модифици- 
рованная архитектура, целью создания которой было снижение требований к 
аппаратным средствам процессора ниже уровня требований набора инструк- 
ций КУЗ21 для самых маленьких встраиваемых систем. Единственным разли- 
чием между КУЗ2[ и КУЗ2Е является уменьшение количества целочислен- 
ных регистров до 15. Ожидается, что это изменение уменьшит занимаемую 
процессором площадь кристалла и энергопотребление примерно на 25% по 
сравнению с аналогичным процессором К\У231. хе остается выделенным ну- 
левым регистром. Уменьшение количества регистров вдвое освобождает 
1 бит в каждом спецификаторе регистра в инструкции. Эти биты гарантиро- 
ванно останутся незадействованными в будущих версиях и, таким образом, 
доступны для использования в пользовательских расширениях инструкций. 


» Расширение О поддерживает 128-битные арифметические операции с пла- 
вающей запятой учетверенной точности согласно определениям стандарта 
ТЕЕЕ 754-2008. 


»е Расширение Г, поддерживает десятичные арифметические операции с пла- 
вающей запятой согласно определениям стандарта ТЕЕЕЁ 754-2008. 


® Расширение В поддерживает побитовые операции, такие как вставка, извле- 
чение и проверка состояния отдельных битов. 


» Расширение { поддерживает динамически транслируемые языки, такие как 
Тауа и Лауа5спре. 


® Расширение Т поддерживает транзакции с памятью, состоящие из недели- 
мых операций по нескольким адресам. 


е Расширение Р’ предоставляет упакованные инструкции ЭМО (с одним по- 
током инструкций и множеством потоков данных) для операций с пла- 
вающей запятой в малых системах ВГЗС-У. 
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» Расширение У поддерживает параллельные или векторные операции с дан- 
ными. Расширение \ не определяет длины векторов данных, это решение ос- 
тается за разработчиками архитектуры процессора В1$С-У. Типичная реали- 
зация расширения \ может поддерживать 512-битные векторы данных, хотя в 
настоящее время доступны реализации с длиной вектора до 4096 бит. 


» Расширение М обеспечивает поддержку обработки прерываний и исключе- 
ний на уровне привилегий Ц. 


» Расширение 74с5г обеспечивает выполнение неделимых операций чтения- 
изменения-записи в системных регистрах СК. Эти инструкции описаны в 
разд. "Системные инструкции" ранее в этой главе. 


е Расширение 7Мепсе определяет инструкцию +епсе.1, описанную в разд. 
"Инструкции доступа к памяти" ранее в этой главе. 


В следующем разделе рассматриваются некоторые из доступных в настоящее время 
вариантов процессоров ВТ$С-У. 


Варианты В1$С-У 


Некоторые области применения, где получили значительное распространение раз- 
личные варианты архитектуры КТЗС-У: 


» Искусственный интеллект и машинное обучение. Компания Езрегащо 
ТесБпо]ор1ез разработала систему на кристалле ($0С) содержащую более 
1000 процессоров К1Т$С-У и разместила шесть таких чипов на одной плате 
РСГе. Это решение оптимизировано для высокопроизводительных рабочих 
нагрузок, выдающих рекомендации на основе машинного обучения в круп- 
ных центрах обработки данных при минимальном энергопотреблении. 


» Встраиваемые системы. Ядро Ейшх УехВ15су — это программный процес- 
сор, предназначенный для реализации на ПЛИС. В УехК15су используется 
набор инструкций КУЗ?21 с расширениями М и С. 


Реализация в виде полнофункциональной $0С-системы включает в себя про- 
цессор, память и выбираемый набор интерфейсов ввода-вывода, таких как 
входы-выходы общего назначения, таймеры, последовательные интерфейсы 
и интерфейсы межчиповой связи, например последовательный периферий- 
ный интерфейс (5епа| репрвега| ице асе, ЗРГ). 


» Вычисления экстремального масштаба. В настоящее время предпринима- 
ется ряд усилий по разработке систем высокопроизводительных вычисле- 
ний (1120-регоптапсе сотрийп?, НРС), которые обычно называют супер- 
компьютерами, основанных на процессорах К$С-У. Среди конкретных 
целей этих проектов — повышение энергоэффективности процессорных ядер 
и расширение возможностей векторной обработки на уровне аппаратных 
средств процессора. 
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е Вычисления со сверхнизким энергопотреблением. Компания М!сго Мар1с 
предлагает 64-разрядное ядро ВГЗС-У с заявленным энергопотреблением все- 
го 0,01 Вт при работе на тактовой частоте 1 ГГц. Такой уровень энергопо- 
требления позволит устройствам с аккумуляторным питанием работать без 
подзарядки в течение нескольких дней, недель или месяцев. 


е Периферийные вычисления в Интернете вещей. Интеллектуальным уст- 
ройствам, работающим в рамках Интернета вещей (Пете! оЁ ТЬп$, ЮюТ), 
может потребоваться высокая вычислительная мощность для решения таких 
задач, как шифрование данных и формирование логических выводов на осно- 
ве методов искусственного интеллекта. При этом они должны работать в ус- 
ловиях жестких ограничений по энергопотреблению, определяемых такими 
факторами, как время работы от аккумулятора и скромные возможности ох- 
лаждения. Некоторые примеры устройств Интернета вещей: камеры дверных 
звонков, процессоры голосовых команд, такие как Ататоп А]еха, и розетки 
питания с поддержкой \/1-Е!. Как и в предыдущих примерах, цели создания 
этих процессоров заключаются в достижении максимальной производитель- 
ности при одновременном ограничении энергопотребления до приемлемого 
уровня. 


Это лишь некоторые из областей применения, где архитектура ВТ$С-У завоевывает 
популярность. Можно ожидать, что расширение использования ЕГЗС-У в этих и 
других областях продолжится. 


Следующий раздел посвящен расширению базовой архитектуры набора инструк- 
ций В]5$С-У до 64 битов. 


64-разрядная архитектура В1$С-\У 


В этой главе обсуждались 32-разрядная архитектура и набор инструкций КУЗ?21, 
а также ряд важных расширений. Набор инструкций ВУ641 расширяет ВУЗ21 до 
64-разрядной архитектуры. Как и в КУЗ?2] инструкции имеют разрядность 32 бита. 
В действительности набор инструкций ВУ64[ почти полностью совпадает с КУЗ?21, 
за исключением следующих существенных различий. 


» Разрядность регистров для целочисленных вычислений увеличена до 64 бит. 
» Длина адресов увеличена до 64 бит. 
» Размерность битового сдвига в опкодах инструкций увеличена с 5 до 6 бит. 


» Предусмотрено несколько новых инструкций для работы с 32-разрядными 
значениями в том же стиле, который применялся в КУЗ2[. Потребность в 
этих инструкциях обусловлена тем, что большинство инструкций в КУ641 
работают с 64-разрядными значениями, и существует много ситуаций, в ко- 
торых требуется эффективная работа с 32-разрядными значениями. Опкоды 
этих ориентированных на слова инструкций имеют суффикс и. Инструкции 
с суффиксом и выдают 32-разрядные результаты со знаком. Для заполнения 
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64-разрядного регистра-приемника эти 32-разрядные значения дополняются 
знаковым битом (даже если они являются беззнаковыми значениями). Дру- 
гими словами, бит 31 каждого результата копируется в биты 32-63. 


В КУ641 определены следующие новые инструкции. 


® аО0м, аЧ41м, зим, $1]м, $111, гм, ги, $гам, зга1м — эти инструкции выполня- 
ются почти идентично инструкциям из ВУЗ21 с теми же именами, за исклю- 
чением суффикса и. Они работают с 32-разрядными операндами и выдают 
32-разрядные результаты. Результаты дополняются знаковым битом до 64 бит. 


® 14, $4 — загрузка и сохранение 64-разрядного двойного слова. Это 64-разряд- 
ные версии инструкций 1м и $м в наборе инструкций КУЗ?21. 


Остальные инструкции из КУЗ21 выполняют те же функции и в ВКУ641, за исключе- 
нием того, что адреса и регистры имеют длину 64 бита. В обоих наборах инструк- 
ций используются одни и те же опкоды — как в исходном коде ассемблера, так и в 
двоичном машинном коде. 


В следующем разделе мы рассмотрим некоторые представленные на рынке стан- 
дартные 32-разрядные и 64-разрядные конфигурации В!$С-У. Каждая из них со- 
стоит из базовой архитектуры набора инструкций (1$А), дополненной выбранными 
расширениями. 


Стандартные конфигурации в!$С-У 


Наборы инструкций КУЗ2Г и К\У64[ предоставляют базовый набор возможностей, 
который подходит в основном для проектов небольших встраиваемых систем. Для 
правильной и эффективной работы систем, которые должны поддерживать много- 
поточность, несколько уровней привилегий и операционные системы общего на- 
значения, требуются соответствующие расширения ВТ$С-У. 


Минимальная конфигурация К]ЗС-У, рекомендуемая для определения цели разра- 
ботки приложения, состоит из базовой архитектуры набора инструкций КУЗ21 или 
КУбАТ, дополненной расширениями 1, М, А, Е, 0, 24с5г и 21№епсе1. Для обозначения 
этой комбинации функций используется буква 6: КУЗ2С или КУ64О. Многие кон- 
фигурации 6 дополнительно поддерживают расширение сжатых инструкций, полу- 
чая при этом обозначение КУЗ2СС или В\У64СС. 


Во встраиваемых решениях распространенной конфигурацией является 
ВУЗ21МАС, предоставляющая базовый набор инструкций наряду с функциями ум- 
ножения/деления, неделимыми операциями и поддержкой сжатых инструкций. 


Эти сокращенные описания возможностей процессора часто используются в марке- 
тинговых материалах о процессорах К1$С-У. | 


В следующем разделе представлена программа на языке ассемблера В1$С-У. 
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Язык ассемблера В!$С-У 


Следующий пример кода на ассемблере К1$С-У представляет собой законченное 
приложение, работающее на процессоре ВТ$С-У: 


.зесе1оп „вех 
.21оба1 та1п 


тма1п: 
# Резервирование места в стеке и сохранение адреса возврата 
ада1 р, $р, -16 
5а га, 0($р) 


# Печать сообщения с помощью функции риф$ библиотеки Си 
1: алрс  а@, #рсге1_В1(т$в) 

ада1 а@, аб, Хрсге1_10о(16) 

3а1 га, риф$ 


# Восстановление адреса возврата и $р, возврат к месту вызова 
а га, 09($р) 
аа91 5$р, $р, 16 
3а1г 7его, га, 0 


.5ес{1оп .годата 
$8: 
.азс17 "Привет, архитектор компьютеров \п" 


Эта программа выводит следующее сообщение в окне консоли, после чего завер- 
шает работу: 


Привет, архитектор компьютеров! 


Ниже описаны некоторые интересные моменты в этом коде ассемблера. 


е Директивы %рсге!1_Н1 и %рсге1_1о выбирают старшие 20 бит (#рсге1_п1) и млад- 
шие 12 бит (%рсге1_10) относительного адреса (со смещением относительно 
программного счетчика) метки, предоставленной в качестве аргумента. Соче- 
тание инструкций ау1рс И ада: помещает адрес строки сообщения в аб. 


» 1: — это локальная метка. При ссылке на локальную метку к ее имени добав- 
ляется буква Ь для указания вышестоящей метки (в обратном направлении) 
или буква + для указания нижестоящей метки (в прямом направлении). Ди- 
рективы #рсге1_Н1 и %рсге1_1о работают в паре: локальная метка 1: преобразу- 
ет младшие 12 бит смещения в адрес сообщения тзв. 


348 Глава 11 


В следующем разделе мы запустим некоторый код в полнофункциональном про- 
цессоре ВТ$С-У, реализованном в ПЛИС. | 


Реализация концепции В1$С-\У в ПЛИС 


Весь исходный код, интеллектуальную собственность на конструкцию аппаратных 
средств процессора и средства разработки, необходимые для создания и построения 
полнофункционального процессора КТЗС-У на основе недорогой ПЛИС (программи- 
руемой логической интегральной схемы), можно найти в свободном доступе в Ин- 
тернете. В этом разделе представлены общий обзор архитектуры В1$С-У с открытым 
исходным кодом и описание действий по ее внедрению в ПЛИС. Общая стоимость 
оборудования для выполнения этой задачи составляет менее 200 долларов США. 


В качестве ПЛИС для реализации ВГЗС-У в этом примере выбрана плата П1рПеп 
Ацу А7-35Т, которую можно приобрести здесь В рз://5оге.Ф1еПепапс.сот/агбу- 
а7-агИх-7-оа-деу@ортеп-Боагд-ГРюг-таКег5-апд- ВобБу56/. На момент написа- 
ния книги плата Апу А7-35Т стоила 129 долларов США. 


Апу А7-35Т содержит ПЛИС ХШих Ашх-7 ХС7АЗ5Т1С$0324-11., которую можно 
запрограммировать для реализации процессора КТ$С-У. Особенности ПЛИС 
ХС7АЗ5Т1К$0324-1: 


® 5200 логических секций; 


» 1600 из них можно использовать для создания 64-разрядной оперативной па- 
мяти; 


» 41 600 триггеров, каждая логическая секция содержит восемь триггеров; 


» 90 секций ОЗР поддерживают высокопроизводительное выполнение опера- 
ций умножения с накоплением для ОЗР; 


» 400 Кбит распределенной операт"вной памяти; 
» 1800 Кбит общей оперативной памяти. 


Для реализации комбинационной логики в архитектуре ПЛИС Атх-7 используют- 
ся таблицы поиска (ГооКОр ТаЫе, ГДУТГ). Каждая таблица поиска Атх-7 имеет 
шесть входных сигналов и один выходной сигнал, где каждый сигнал представляет 
собой 1 бит данных. Одна таблица поиска может представлять любую схему без 
обратной связи, состоящую из вентилей И, ИЛИ, НЕ и "исключающее ИЛИ", рабо- 
тающих с шестью входными сигналами путем простого сохранения результатов 
каждой входной комбинации в виде бита в небольшом ПЗУ. При наличии шести 
входных битов это ПЗУ содержит 64 (2°) бита данных, адресуемых шестью вход- 
ными сигналами. При желании каждую таблицу поиска также можно представить в 
виде двух 32-разрядных таблиц поиска, работающих на пяти общих входах с двумя 
выходными битами. Как вариант, выход таблицы поиска можно сохранить в тригтере. 


Логическая секция содержит четыре таблицы поиска и восемь триггеров плюс 
дополнительный мультиплексор и логику арифметического переноса. Четыре 
из восьми триггеров в секции можно настроить как защелки. На основе любой из 
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1600 секций, поддерживающих возможность создания 64-разрядной оперативной 
памяти, можно также реализовать 32-разрядный регистр сдвига или два 16-разряд- 
ных регистра сдвига. 


Низкоуровневые таблицы поиска и другие средства, реализуемые несколькими ты- 
сячами логических секций, представляют собой исходные элементы, необходимые 
для сборки полнофункционального процессора В1$С-У и периферийных устройств 
в рамках одной ПЛИС. Процесс программирования ПЛИС заключается в соедине- 
нии компонентов ПЛИС для формирования сложного цифрового устройства, опре- 
деленного с помощью языка описания аппаратных средств. 


С точки зрения разработчика системы нет необходимости разбираться в деталях 
внутреннего механизма ПЛИС Х!их. Разработчик действует на уровне языка опи- 
сания аппаратных средств. Такой инструмент, как У1уадо, представленный в реше- 
ниях к упражнениям в главе 2, переводит код на языке описания аппаратных 
средств (обычно УНОГ, или УеШор, хотя оригинальный проект ВТ$С-У реализован 
на языках Ср1зе] и Зса|а) в скомпилированный формат, подходящий для програм- 
мирования ПЛИС. 


Основные вопросы, требующие внимания разработчика в отношении ПЛИС, за- 
ключаются в том, чтобы проект системы учитывал ограничения ресурсов ПЛИС, 
а итоговая реализация работала с приемлемой производительностью. В данном 
примере объем ресурсов, предлагаемых ПЛИС ХС7АЗ5Т1С$0324-П., более чем 
достаточен для реализации процессора ВТЗС-У. 


Для разработки и запуска программ на ВТ$С-У-процессоре Апу А7-35Т также ну- 
жен недорогой аппаратный отладчик. Отладчик ОНтех АКМ-ТГМУ-ОЗВ-Н можно 
приобрести по цене 47,65 доллара США здесь: В@рз://уу\у\у.@рЩеу.сот/ргодис:- 
ЧеаШеп/ойтех-#9/АВМ-05В-ТИМУ-НЛ1188-1013-№0/3471388. Вам также пона- 
добятся провода для подсоединения отладчика к плате Ацу А7-35Т. Их можно 
приобрести по цене 3,95 доллара США здесь: В@рз://му\у\у.адайий.сот/ргодис/ 
826. Наконец, для подсоединения процессора Апу А7-35Т к главному компьютеру 
через разъем Мсто0$В-В нужен Ч$В-кабель. Все программное обеспечение и про- 
ектные данные, необходимые для реализации К1$С-У-процессора в Ацу, можно 
бесплатно загрузить из Интернета. 


Процессор, который мы реализуем на основе Апу А7-35Т, — это Ргеедот ЕЗ10 
Аму, открытая реализация ядра КУЗ2МАС с поддержкой обработки прерываний. 
Для периферийных устройств предусмотрены 16 сигналов входов-выходов общего 
назначения (репега! ригрозе ГО, ОРТО) и последовательный порт. 


Процессор Егеедот ЕЗ10 предоставляется в виде исходного кода и поэтому может 
быть изменен пользователями, которые хотят реализовать собственные версии 
процессора. В аппаратном коде процессора КТЗС-У применяются языки описания 
аппаратных средств СЫ $е| и Зса[а. 


Сы15е! — это специализированный язык, предназначенный для разработки сложных 
цифровых аппаратных устройств, таких как система на кристалле ($оС). СЬ15е] за- 
пускается поверх Зсайа, современного языка программирования общего назначе- 
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ния, поддерживающего парадигмы функционального и объектно-ориентированного 
программирования. Эса!а — это полностью объектно-ориентированный язык, в ко- 
тором каждое значение — это объект. Он также является функциональным языком 
в том смысле, что каждая функция является значением. Зса!а компилируется в 
байт-код Гауа и запускается на стандартной виртуальной машине Лауа. Программы 
на языке Эса]а могут напрямую использовать любую из тысяч доступных библио- 
тек Тауа. 


ПОДДЕРЖКА ПОЛЬЗОВАТЕЛЬСКИХ РАСШИРЕНИЙ В В!$С-У 


Архитектура ВТЗС-У явно поддерживает пользовательские версии в 
виде настраиваемых опкодов, сопроцессоров и других модификаций, 
и при условии, что они совместимы с правилами адаптации КГЗС-У к 
\^ требованиям пользователя. Взяв за основу открытую архитектуру Е1$С-У, 
вы можете реализовать пользовательские модификации, которые гаран- 
тированно останутся совместимыми с будущими версиями стандартов и 
‚расширений В1ЗС-У. 


При проектировании сложных цифровых систем некоторых категорий языки Се] 
и Зса|а благодаря своей высокоуровневой природе сегодня являются более пред- 
почтительными по сравнению с традиционными языками описания аппаратных 
средств, такими как УНПОГ, и Уеор. Любая схема, которую можно спроектировать 
в СЫ$е1, также может быть спроектирована и в УНПОГ, однако использование Сщ5е] 
имеет некоторые важные преимущества. Например, процесс компиляции преобра- 
зует код на Сы15е/5са1а в форму, называемую гибким промежуточным представ- 
лением для ВТЕ (НехЫе Пицегпефае Кергеземайоп юг ВТЕ, ЕВВТГ,), где ВТЕ 
(герл$ег тапзЁег 1еуе!) означает уровень межрегистровой передачи. КТГ, — это 
уровень абстракции в языках описания аппаратных средств синхронных схем, та- 
ких как УНОГ.. Используя бесплатные инструменты, можно оптимизировать пред- 
ставление схемы в ЕГВКТГ, что позволит создать более производительную реали- 
зацию ПЛИС по сравнению с сопоставимым решением на УНП, или Уеп]ор. 


Одним из способов оценить разницу между С15е| и УНОГ/Уеор является анало- 
гичное различие между языками программирования РуШоп и С. Вы можете реали- 
зовать функциональный эквивалент любой программы Ру®оп на С, однако про- 
граммы на Ру®оп могут в нескольких строках кода выразить функциональность 
гораздо более высокого уровня, чем программа аналогичного размера на С. 


Мы можем сравнить код С№5е] с примером УНПГ,, приведенным в разд. "Языки опи- 
сания аппаратных средств" главы 2. Рассмотрим версию одноразрядного полного 
сумматора на УНОГ, представленную в этой главе и показанную в следующем коде: 


-- Загрузка стандартных библиотек 


]16гагу ТЕЕЕ; 
изе ТЕЕЕ.$5ТО_106ТС_1164.АНЕ; 
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-- Определение входов и выходов полного сумматора 


епЕ1Фу РОЁЕ_АООЕВ 15 


роге ( 
А : Ш $149_1061с; 
В г т $14 1051с; 
СМ : т $14 10Е1с; 
5 : О $44 19051с; 
СОТ : ош $14 1061с 
); 


еп епе1%у РУШ._АООЕВ; 

-- Определение поведения полного сумматора 
агсЬ1$ес®иге ВЕНАМТОВАЕ о+ РУ АООЕВ 1$ 
бев1п 


5 <= (А ХОВ В) ХОВ С ТН; 
СО <= (ААЮ в) ОВ ((А ХОВ В) АЮ С 1№); 


еп агс/1{Фесеиге ВЕНАУТОКАЕ ; 


Эквивалент полного сумматора на языке Ср15е! показан в следующем блоке кода: 


1троге сп1$е13._ 


с1а$$ Ри11Адаег ехееп4$ Моду1е { 
уа1 10 = ТО(пем Випа]е { 


уа] а = Тпри*(УТп*(1.м)) 
уа1 Ь = Тпри®(УТпе(1.м)) 
уа1 с_1п = ТприЕ(УТт(1.м)) 
уа1 $ = Оири*(ИТптЕ(1.м)) 
уа1 с_оце = Очери(ИТпт*(1.м)) 
}) 
10.5 := (10.а ^ 10.5) ^ 1ю.слт 
10.с_оц* := (10.а & 10.6) | ((10.а ^ 10.5) & 1ю.с п) 
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В этом коде Се] пакет 10 определяет входы и выходы модуля. Аргумент каждого 
параметра Тприе и ОиёриЕ определяет тип данных (141) и битовую ширину (1.м ука- 
зывает, что каждый входной и выходной сигнал имеет ширину 1 бит). 


Этот простой пример не способен продемонстрировать весь спектр преимуществ 
разработки сложных схем в Ср15е|, однако он показывает, что на уровне подробной 
реализации этот код не слишком отличается от УНОГ. Здесь мы не будем углуб- 
ляться в детали Ср15е|. Для получения дополнительной информации обратитесь к 
репозиторию СЪ15е] по адресу В@рз://> НпиБ.сот/геесрурго]ес Ис 5е!13. 


Процесс создания процессора ВТ$С-У и его программирования на плате Апу А7-35Т 
состоит из следующих шагов: 


1. Трансляция кода СБ15е] и Зса|а в формат ВЕТ. 
2. Трансляция НВКТГ. в УегШор. 

3. Компиляция Уеор в образ ПЛИС. 

4. Загрузка образа ПЛИС в плату Апу А7-35Т. 


Пошаговое руководство по реализации процессора ВТ$С-У на плате Ацу А7-35Т 
можно найти на форуме ГП\р-Кеу Ееснотсз ТесвЕРогат по адресу 
В@рз:/Логит. Фр Кеу.сот//4оНепе-агбу-а7-\у-хШпх-агЯх-7-ппретепЯп?2-$уе- 
Ге310-115с-у. 


Когда вы загрузите образ.К1$С-У в плату Ацу, к ней через интерфейс отладчика 
можно подключить пакет разработки программного обеспечения. После этого вы 
можете разрабатывать код К1Т$С-У на языке ассемблера или языках высокого уров- 
ня, компилировать его и запускать на процессоре ВТЗС-У, реализованном в ПЛИС, 
таким же образом, как и на аппаратном процессоре. 


Резюме 


В этой главе представлены архитектура и набор инструкций процессора КТ$ЗС-У. 
Архитектура КТ$С-У определяет полную спецификацию набора инструкций для 
пользовательского и привилегированного режимов и ряд расширений для поддерж- 
ки вычислений общего назначения, высокопроизводительных вычислений и 
встраиваемых приложений, требующих минимального размера кода. Процессоры 
ВТЗС-У доступны на рынке. Кроме того, предлагаются бесплатные продукты с от- 
крытым исходным кодом для реализации К]$С-У на устройствах ПЛИС. 


Прочитав эту главу, вы получили знания об архитектуре и возможностях процессо- 
ра ВТЗС-У и предлагаемых отдельно расширений. 


Вы ознакомились с основами набора инструкций ВТЗС-У и теперь понимаете, как 
его можно адаптировать для поддержки приложений в различных областях — от 
недорогих маломощных встраиваемых систем до ферм облачных серверов разме- 
ром с большой склад. Вы также узнали, как реализовать процессор ВТ$С-У на не- 
дорогой плате ПЛИС. 
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В следующей главе вводится концепция виртуализации процессоров, в рамках ко- 
торой вместо выполнения кода непосредственно на главном процессоре реализует- 
ся целая виртуальная среда для запуска одного или нескольких виртуальных про- 
цессоров, каждый из которых имеет собственную операционную систему и 
приложения, на одном физическом процессоре. 


Упражнения 


1. Посетите сайт ВИрз://\у\у\.$Нуе.сот/5оЙ\уаге/ и скачайте пакет ЁРгеедот 
5{ио. Это пакет разработки, основанный на интегрированной среде разра- 
ботки (ФЕ) ЕсПрзе, который оснащен полным набором инструментов для соз- 
дания приложения ВТЗС-У и его запуска на аппаратном процессоре ВТ$С-У или 
в среде эмуляции, включенной в комплект Егеедот 39410. Установите пакет, 
следуя указаниям в руководстве пользователя Егеедот Зи. Запустите 
Егеедот и создайте новый проект Егеедот Е $ОК. В окне создания проекта в 
качестве цели выберите дети-$Шуе-и54 (это 64-разрядный одноядерный про- 
цессор КТЗС-У в конфигурации КУ64СС). Выберите программу-пример пе11о и 
нажмите кнопку ЕниВ (Готово). Запустится сборка программы-примера и эму- 
лятора К!$С-У. После завершения сборки отображается окно ЕЗИ 
СопйригаНоп (Изменение конфигурации). Нажмите ОеБи? (Отладка), чтобы 
запустить программу в среде отладки эмулятора. Проведите пошаговое выпол- 
нение программы и убедитесь, что в окне консоли отображается строка "Нео, 
\ота!" ("Здравствуй, мир!"). 


2. Не закрывая проект из упражнения 1, в окне Рго}есё (Проект) найдите файл 
пе110.с в папке $гс. Щелкните правой кнопкой мыши на файле и переименуйте 
его в пе11о.5. Откройте файл пе11о.5 в редакторе и удалите все содержимое. 
Вставьте программу на языке ассемблера, приведенную в разд. "Язык ассемб- 
лера Е15С-И" этой главы. Выполните очистку, а затем снова соберите проект 
(чтобы запустить операцию очистки, нажмите комбинацию клавиш 
<Си]>+<9>). В меню Вип (Выполнение) выберите команду Оефие (Отладка). 
После запуска отладчика откройте окно для отображения исходного файла 
пе11о.5, окно О\баззет у (Дизассемблирование) и окно Вер1%ег$ (Регистры). 
Раскройте дерево Вер1$ег$ (Регистры), чтобы отобразить регистры процессора 
ВГЗС-У. Проведите пошаговое выполнение программы и убедитесь, что в окне 
консоли отображается строка "Привет, архитектор компьютеров!". 


3. Напишите программу на языке ассемблера В1$С-У, которая вычисляет сле- 
дующее выражение и выводит результат в виде шестнадцатеричного числа: 
[(129 — 66) х (445 + 36})] : 3. В этой же программе создайте вызываемую функ- 
цию для печати одного байта в виде двух шестнадцатеричных цифр. 
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Виртуализация процессоров 


В этой главе представлены концепции, заложенные в основу виртуализации про- 
цессоров, и рассматриваются многочисленные преимущества ее эффективного ис- 
пользования для отдельных пользователей и крупных организаций. Мы обсудим 
основные методы виртуализации, а также открытые и коммерческие инструменты 
для их реализации. 


Средства виртуализации позволяют эмулировать точные представления наборов 
инструкций различных компьютерных архитектур и операционных систем на ком- 
пьютерах общего назначения. Виртуализация широко применяется при разверты- 
вании реальных программных приложений в облачных средах. 


После прочтения этой главы вы будете обладать знаниями о технологиях аппарат- 
ной виртуализации и предлагаемых ими преимуществах, а также о том, как совре- 
менные процессоры поддерживают виртуализацию на уровне набора инструкций. 
Вы ознакомитесь с техническими особенностями нескольких открытых и коммер- 
ческих инструментов, предоставляющих средства виртуализации, и узнаете, как 
виртуализация используется для создания и развертывания масштабируемых при- 
ложений в средах облачных вычислений. 


В этой главе будут представлены следующие темы: 
»е введение в виртуализацию; 
» проблемы виртуализации; 
» виртуализация современных процессоров; 
» инструменты виртуализации; 


® виртуализация и облачные вычисления. 
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Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 
В рб: //оВиБ.сот/РаскРи БИ то/Модегп-Сотршег-АгсВКесвиге-апд- 
ОграптаНоп-5есопд-ЕЧ0п. 


Введение в виртуализацию 


В области компьютерной архитектуры понятие "виртуализация" относится к ис- 
пользованию аппаратных средств и программного обеспечения для создания эму- 
лируемой версии среды для выполнения программ, в отличие от реальной среды, 
в которой обычно выполняется код. 


В главе 7 мы уже рассмотрели одну из форм виртуализации — виртуальную па- 
мять. Виртуальная память подразумевает использование программного обеспече- 
ния в сочетании с поддерживающими аппаратными средствами для создания сре- 
ды, в которой каждое запущенное приложение функционирует так, как если бы оно 
имело эксклюзивный доступ ко всем ресурсам компьютера, включая всю требуе- 
мую память по предполагаемым адресам. Благодаря этому диапазоны виртуальных 
адресов, с которыми работает программа, могут совпадать с теми, которыми опери- 
руют другие запущенные в данный момент процессы. 


Системы, использующие виртуальную память, создают множество песочниц, в ко- 
торых каждое приложение выполняется без вмешательства других приложений, за 
исключением конкуренции за общие системные ресурсы. 


В контексте виртуализации песочница — это изолированная среда, в которой код 
выполняется без вмешательства из-за ее пределов, и которая предотвращает воз- 
действие выполняемого внутри нее кода на внешние ресурсы. Однако изоляция 
между приложениями редко бывает абсолютной. В частности, даже если в системе 
виртуальной памяти один процесс не может получить доступ к памяти другого 
процесса, он может сделать что-то еще, например удалить файл, который необхо- 
дим второму процессу, что может вызвать проблемы для этого процесса. 


Основным предметом внимания в этой главе будет виртуализация на уровне про- 
цессора, которая позволяет одной или нескольким операционным системам рабо- 
тать на компьютерной системе в виртуализированной среде. Эта виртуальная среда 
работает на абстрактном уровне относительно физических аппаратных средств сис- 
темы. 


В следующем разделе будут кратко описаны различные типы виртуализации, с ко- 
торыми вы можете столкнуться. 
Типы виртуализации 


Термин "виртуализация" применяется в нескольких различных вычислительных 
контекстах, в частности в отношении крупных сетевых сред, таких как коммерче- 
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ские предприятия, университеты, правительственные организации и поставщики 
облачных услуг. Приведенные далее определения охватывают наиболее распро- 
страненные типы виртуализации, с которыми вы можете встретиться. 


Виргуализация операционных систем 


Виртуализированная операционная система работает под управлением гипервизо- 
ра. Гипервизор представляет собой комбинацию программного обеспечения и ап- 
паратных средств, которая способна создавать экземпляры виртуальных машин и 
запускать их. Виртуальная машина — это эмуляция целой компьютерной систе- 
мы. Префикс гипер- в слове "гипервизор" указывает на тот факт, что гипервизор 
имеет более высокий уровень привилегий, чем режим супервизора операционных 
систем, запущенных на его виртуальных машинах. Другим термином для обозначе- 
ния гипервизора является монитор виртуальных машин. 


Различают два основных типа гипервизоров: 


» Гипервизоры типа 1, иногда называемые аппаратными, представляют со- 
бой программную среду для управления виртуальными машинами, которая 
выполняется непосредственно на физическом оборудовании главного ком- 
пьютера (хоста). 


е Гипервизоры типа 2, также называемые хостовыми, работают как запус- 
каемая в операционной системе хоста прикладная программа, управляющая 
виртуальными машинами. 


ГИПЕРВИЗОР И МОНИТОР ВИРТУАЛЬНЫХ МАШИН 


С технической точки зрения, монитор виртуальных машин — это не 
совсем то же самое, что гипервизор, но для наших целей мы будем рас- 
сматривать эти термины как синонимы. Монитор виртуальных машин 


2-4 отвечает за виртуализацию процессора и других компонентов компью- 
терной системы. А гипервизор объединяет монитор виртуальных ма- 


шин с базовой операционной системой, которая может быть специально 
предназначена для размещения виртуальных машин (гипервизор ти- 
па |1) или может быть операционной системой общего назначения (ги- 
первизор типа 2). 


Компьютер, на котором запущен гипервизор, называют хостом. Операционные 
системы, работающие в управляемых гипервизором виртуальных средах на хосте, 
называют гостевыми. 


Независимо от типа, гипервизор позволяет запускать в виртуализированных средах 
гостевые операционные системы и работающие в них приложения. Он может под- 
держивать несколько виртуальных машин, одновременно работающих на одном 
процессоре. 
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Гипервизор отвечает за управление всеми запросами на привилегированные опера- 
ции, инициируемые гостевыми операционными системами и запущенными в них 
приложениями. Каждый запрос требует перехода из пользовательского режима в 
режим ядра и обратно в пользовательский режим. Как и в невиртуализированных 
операционных системах, все запросы на ввод-вывод от приложений в гостевых 
операционных системах связаны с переходом на привилегированный уровень. 


Поскольку виртуализация операционной системы с помощью гипервизора типа 2 
предполагает запуск операционной системы под гипервизором в операционной 
системе хоста, возникает естественный вопрос: что произойдет, если вы запустите 
другую копию гипервизора в операционной системе виртуальной машины? Ответ 
заключается в том, что такая возможность поддерживается в некоторых, но не во 
всех комбинациях гипервизора, ОС хоста и гостевой ОС. Такую конфигурацию на- 
зывают вложенной виртуализацией. 


Следующим вопросом, который может возникнуть в связи с концепцией вложен- 
ной виртуализации: зачем кому-то может это понадобиться? Вот один из возмож- 
ных сценариев, демонстрирующий пользу вложенной виртуализации: предполо- 
жим, что присутствие вашего бизнеса в Интернете реализовано в виде 
виртуализированного образа операционной системы, содержащего различные пре- 
дустановленные и пользовательские программные компоненты. Если инфраструк- 
тура вашего поставщика облачных услуг по какой-либо причине отключится от 
Интернета, вам потребуется быстро запустить свое приложение у альтернативного 
поставщика. 


Ооойе Сотрше Епрше (6 @рз://с10и4.гоо?е.сот/сотрие), например, предоставля- 
ет среду выполнения, реализованную в виде виртуальной машины. Сотрше Епёше 
позволяет установить на эту виртуальную машину гипервизор и запустить в нем 
виртуальную машину с вашим приложением, оперативно вернув ваше присутствие 
в Интернете с минимальной потребностью в дополнительных действиях по уста- 
новке и настройке. 


Виртуализация приложений 


Вместо создания виртуальной среды для инкапсуляции всей операционной системы 
возможна виртуализация на уровне отдельного приложения. Виртуализация при- 
ложений абстрагирует операционную систему от кода приложения и обеспечивает 
определенную степень изоляции. 


При таком типе виртуализации программы могут выполняться в среде, которая от- 
личается от предусмотренной целевой среды приложений. Например, ИЛпе 
(В@рз://лу\ууу мшейО.0ого/) — это программа, реализующая слой совместимости 
приложений, который позволяет программам, написанным для Мсгозой \/тдо\з, 
запускаться в операционных системах, совместимых с РОЫХ, обычно в вариантах 
ОС Ипих. 


Интерфейс переносимых операционных систем (роцаШе орегайпр зузмет пиег- 
асе, РОЗХ) представляет собой набор стандартов ГЕЕЁ, обеспечивающих совмес- 
тимость программирования приложений между операционными системами. 
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У! те реализует эффективную трансляцию обращений к библиотекам и системным 
функциям \Мт9до\$ в эквивалентные вызовы РОЗХ. 


Виртуализация приложений заменяет части среды выполнения уровнем виртуали- 
зации и выполняет такие задачи, как перехват вызовов дискового ввода-вывода и 
их перенаправление в изолированную виртуализированную дисковую среду. 


Виртуализация приложений может инкапсулировать сложный процесс установки 
программного обеспечения, охватывающий сотни файлов, устанавливаемых в раз- 
личные каталоги, и многочисленные изменения в реестре У! т4до\$, в эквивалент- 
ную виртуализированную среду, содержащуюся в одном исполняемом файле. 


Простое копирование этого исполняемого файла в целевую систему и его запуск 
приводят к установке приложения таким же образом, как если бы весь процесс ус- 
тановки происходил в целевой системе. 


Виртуализация сетей 


Виртуализация сетей — это соединение программных эмуляций сетевых компо- 
нентов, таких как коммутаторы, маршрутизаторы, межсетевые экраны и телеком- 
муникационные сети, таким способом, который отражает физическую конфигура- 
цию этих компонентов. Это позволяет операционным системам и запущенным в 
них приложениям, взаимодействовать с виртуальной сетью и обмениваться данны- 
ми по ней таким же образом, как и при физической реализации той же сетевой ар- 
хитектуры. 


Одну физическую сеть можно разделить на несколько виртуальных локальных 
сетей (ушиа| [оса] агеа пебхотк, УГАМ), каждая из которых представляется полно- 
функциональной изолированной сетью для всех систем, подключенных к ней. 


Несколько компьютерных систем в одном и том же физическом местоположении 
можно подключить к разным УГАМ, что фактически равносильно размещению их в 
отдельных сетях. И наоборот, компьютеры, находящиеся на значительном отдале- 
нии друг от друга, можно объединить в одну УГ.АМ, при этом создается впечатле- 
ние, что они связаны между собой в рамках небольшой локальной сети. 


Виртуализация хранилищ 


Виртуализация хранилищ — это абстрагирование физического хранилища данных 
от логической структуры хранения, используемой операционными системами и 
приложениями. Система виртуализации хранилищ управляет процессом трансля- 
ции логических запросов данных в физические операции передачи данных. 


Логические запросы данных адресуются как места расположения блоков в разделе 
диска. После трансляции логических запросов данных в физические запросы опе- 
рации передачи данных могут в конечном счете работать С устройством хранения, 
организация которого полностью отличается от лог ической структуры диска. 


Процесс доступа к физическим данным по заданному логическому адресу во мно- 
гом похож на процесс преобразования виртуального адреса в физический в сис- 
темах виртуальной памяти. Запрос ввода-вывода логического диска включает в 
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себя такую информацию, как идентификатор устройства и номер логического 
блока. Этот запрос преобразуется в идентификатор физического устройства и но- 
мер блока. Затем на физическом диске выполняется запрошенная операция чтения 
или записи. 


Виртуализация хранилищ в центрах обработки данных часто включает в себя не- 
сколько усовершенствований, повышающих надежность и производительность 
систем хранения данных. Вот некоторые из них. 


» Централизованное управление позволяет осуществлять мониторинг и 
управление большим набором устройств хранения данных, возможно, разной 
емкости и от разных поставщиков. 


Поскольку все виртуализированные хранилища выглядят для клиентских 
приложений одинаково, любые различия в устройствах хранения, зависящие 
от конкретного поставщика, скрыты от пользователей. 


» Репликация обеспечивает прозрачное резервное копирование данных, пре- 
доставляя возможности аварийного восстановления критически важной ин- 
формации. При выполнении репликации в реальном времени операции запи- 
си в массив хранения немедленно копируются в одну или несколько 
удаленных реплик. 


» Перенос данных позволяет администраторам перемещать данные в другое 
физическое местоположение или переключаться на реплику без прерывания 
параллельных операций ввода-вывода данных. Поскольку система управле- 
ния виртуализацией хранилища имеет полный контроль над дисковым вво- 
дом-выводом, она может в любое время переключить любую логическую 
операцию чтения или записи с одного физического устройства на другое. 


В следующем разделе будут представлены некоторые из наиболее распространен- 
ных в настоящее время методов виртуализации процессоров. 


Категории виртуализации процессоров 


Идеальным режимом работы для среды виртуализации процессоров является пол- 
ная виртуализация. В этом случае двоичный код в операционных системах и при- 
ложениях выполняется в виртуальной среде без каких-либо изменений. Для кода 
гостевой операционной системы, выполняющего привилегированные операции, 
создается иллюзия, что он имеет полный и единоличный доступ ко всем ресурсам и 
интерфейсам машины. Гипервизор управляет транзакциями между гостевыми опе- 
рационными системами и ресурсами хоста и предпринимает любые шаги, необхо- 
димые для устранения конфликтов доступа к устройствам ввода-вывода и другим 
системным ресурсам для каждой виртуальной машины, находящейся под его кон- 
тролем. 


В этой главе мы сосредоточимся на виртуализации процессоров, которая обеспечи- 
вает работу полнофункциональных операционных систем и запущенных в них при- 
ложений в виртуализированной среде. 
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Исторически сложилось так, что для реализации виртуализации на уровне процес- 
сора использовалось несколько различных подходов. Мы кратко рассмотрим каж- 
дый из них, начиная с подхода, впервые реализованного в таких системах, как ВМ 
УМ/370, который был представлен в 1972 г. УМ/370 была первой операционной 
системой, разработанной специально для поддержки работы виртуальных машин. 


Виртуализация с перехватом и эмуляцией 


В вышедшей в 1974 г. статье под названием "Формальные требования к виртуали- 
зуемым архитектурам третьего поколения" ("Еоппа| Кедитетет$ Гог Ушша|2аЫе 
ТЬга Сепеганоп АтгсЬКесвгез") Геральд Попек (Сега]4 7. Рорек) и Роберт П. Голд- 
берг (КоБеп Р. СоБегР)) описали три свойства, которыми должен обладать гипер- 
визор для эффективной и полной виртуализации компьютерной системы, включая 
процессор, память, хранилище и периферийные устройства. 


» Идентичность. Программы (включая гостевые ОС), работающие под управ- 
лением гипервизора, должны демонстрировать поведение, по существу иден- 
тичное тому, которое они проявляют при запуске непосредственно на аппа- 
ратных средствах компьютера, исключая влияние синхронизации. 


е Управление ресурсами. Гипервизор должен иметь полный контроль над 
всеми ресурсами, используемыми виртуальной машиной. 


» Эффективность. Значительная доля инструкций, выполняемых виртуальной 
машиной, должна выполняться непосредственно на физическом процессоре 
без вмешательства гипервизора. 


Для того чтобы гипервизор удовлетворял этим критериям, аппаратные средства и 
ОС компьютера, на котором он запущен, должны предоставить гипервизору пол- 
ный контроль над виртуальными машинами, которыми он управляет. 


Код гостевой ОС предполагает, что он выполняется непосредственно на аппарат- 
ных средствах физического процессора и имеет полный контроль над всеми функ- 
циями, доступными через аппаратные средства системы. Код гостевой ОС, рабо- 
тающий на уровне привилегий ядра, должен иметь возможность выполнять 
привилегированные инструкции и получать доступ к областям памяти, зарезерви- 
рованным для операционной системы. 


В гипервизоре, реализующем метод виртуализации с перехватом и эмуляцией, час- 
ти гипервизора выполняются с привилегиями ядра, в то время как все гостевые ОС 
(и запущенные в них приложения) работают на уровне привилегий пользователя. 
Код ядра в гостевых ОС выполняется нормально до тех пор, пока не будет пред- 
принята попытка выполнить привилегированную инструкцию или инструкция дос- 
тупа к памяти не попробует прочитать или записать память за пределами диапазона 
адресов пользовательского пространства, доступного гостевой ОС. Когда гостевая 
ОС попытается выполнить любую из этих операций, произойдет перехват. 
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ТИПЫ ИСКЛЮЧЕНИЙ: ОШИБКИ, ЛОВУШКИ, АВАРИИ 


Термины "ошибка", "ловушка" и "авария" используются для описания 
похожих событий исключения. Основные различия между исключе- 
ниями каждого из этих типов заключаются в следующем. 


Ошибка (и) — это исключение, которое заканчивается перезапус- 
ком вызвавшей его инструкции. Например, ошибка страницы (отказ. 
страницы) возникает, когда программа пытается получить доступ к до- 
пустимой ячейке памяти, которая в данный момент недоступна. После 
завершения работы обработчика ошибок страниц вызвавшая это ис-- 

< ключение инструкция запускается снова, и выполнение продолжается с 
этого момента. 


Ловушка (кар) — это исключение, которое завершается продолжением 
выполнения программы, начиная с инструкции, следующей за инструк- 
цией, вызвавшей данное исключение. Например, выполнение возобнов- 
ляется после исключения, вызванного контрольной точкой отладчика, 
начиная со следующей инструкции. 


Авария (або) — отражает состояние серьезной ошибки, которая мо- 
жет быть неустранимой. Причинами аварий могут быть такие пробле- 
мы, как ошибки доступа к памяти. 


Фундаментальный трюк (если можно выразиться таким образом) для внедрения 
виртуализации с перехватом и эмуляцией заключается в обработке исключений, 
генерируемых нарушениями привилегий. Во время запуска гипервизор перена- 
правляет обработчики исключений операционной системы хоста в собственный 
код. Иными словами, обработчики исключений в гипервизоре получают возмож- 
ность обрабатывать эти исключения до их обработки в ОС хоста. 


Обработчик исключений в гипервизоре проверяет источник каждого исключения, 
чтобы определить, было ли оно сгенерировано гостевой ОС под управлением ги- 
первизора. Если исключение исходит от гостевой ОС, которой управляет гиперви- 
зор, то гипервизор обрабатывает это исключение, эмулируя запрошенную опера- 
цию, и возвращает управление выполнением непосредственно гостевой ОС. Если 
исключение не было порождено гостевой ОС, относящейся к гипервизору, то ги- 
первизор передает это исключение операционной системе хоста для обработки 
обычным способом. 


Для того чтобы виртуализация с перехватом и эмуляцией работала надежно и в 
полную силу, процессор хоста должен поддерживать критерии, определенные 
Попеком и Голдбергом. Наиболее важное из этих требований заключается в том, 
чтобы выполнение любой гостевой инструкции, пытающейся получить доступ к 
привилегированным ресурсам, генерировало исключение типа "ловушка" (т.е. ини- 
циировало перехват). Это необходимо, т. к. система хоста имеет только один набор 
привилегированных ресурсов (для простоты мы предполагаем, что здесь использу- 
ется одноядерная система), т. е. ОС хоста и гостевые ОС не могут одновременно 
осуществлять контроль одних и тех же ресурсов. 
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В качестве примера привилегированной информации, которой управляет гипервизор, 
рассмотрим таблицы страниц, используемые для управления виртуальной памятью. 


Операционная система хоста поддерживает набор таблиц страниц, которые контро- 
лируют всю физическую память системы. Каждая гостевая ОС имеет свой набор 
таблиц страниц, которые, с ее точки зрения, используются для управления физиче- 
ской и виртуальной памятью в системе, ею управляемой. Эти два набора таблиц 
страниц содержат существенно различающиеся данные, хотя оба набора в конеч- 
ном счете взаимодействуют с одними и теми же областями физической памяти. 


С помощью механизма ловушек гипервизор перехватывает все попытки гостевой 
ОС взаимодействовать с таблицами страниц и направляет эти транзакции в область 
памяти, отведенную для гостевой системы, где содержатся таблицы страниц, ис- 
пользуемые только этой гостевой ОС. Затем гипервизор организует необходимую 
трансляцию адресов, используемых инструкциями, выполняемыми в гостевой ОС, 
в адреса физической памяти хоста. 


Самым большим препятствием для широкого распространения виртуализации в 
конце 1990-х и начале 2000-х годов был тот факт, что широко используемые в то 
время процессоры общего назначения (варианты х86) не соответствовали критери- 
ям виртуализации Попека и Голдберга. 


Наборы инструкций х86 содержали несколько инструкций, которые позволяли не- 
привилегированному коду взаимодействовать с привилегированными данными без 
генерирования ловушки. Многие из этих инструкций просто разрешали непривиле- 
гированному коду считывать отдельные привилегированные регистры. Такой под- 
ход мог показаться безобидным, однако его применение представляло серьезную 
проблему для виртуализации, поскольку в машине имеется только одна копия каж- 
дого из этих регистров, а каждой гостевой ОС может потребоваться держать разные 
значения в этих регистрах. 


В более поздних версиях процессоров семейства х86, начиная с 2006 г., были добавле- 
ны аппаратные функции Пе] уп{иаНтаНоп {есВпо]огу (УТ-х) и АМО уй\иа|2аЯ оп 
(АМО-У), которые позволили реализовать полную виртуализацию согласно крите- 
риям Попека и Голдберга. 


Требования к виртуализации, определенные Попеком и Голдбергом, предполагали, 
что виртуализация с перехватом и эмуляцией, считавшаяся в 1970-х годах единст- 
венным практическим методом виртуализации, была единственным осуществимым 
подходом к виртуализации процессоров. В следующих разделах мы увидим, как 
можно реализовать действенную и эффективную виртуализацию в компьютерной 
системе, которая не полностью соответствует критериям Попека и Голдберга. 


Паравиртуализация 


Поскольку большинство, если не все инструкции, требующие специальной обра- 
ботки в виртуализированной среде, находятся в гостевой ОС и ее драйверах уст- 
ройств, одним из способов сделать гостевую среду пригодной для виртуализации 
является изменение операционной системы и ее драйверов таким образом, чтобы 


364 Глава 12 


они явным образом взаимодействовали с гипервизором без использования ловушек. 
Такой подход называется паравиртуализацией. 


Этот подход может существенно повысить производительность гостевой ОС по 
сравнению с системой, работающей под управлением гипервизора с перехватом и 
эмуляцией, поскольку паравиртуализированный интерфейс гипервизора состоит из 
оптимизированного кода, а не из серии обращений к обработчикам ловушек. В ме- 
тоде с перехватом и эмуляцией гипервизор должен обрабатывать каждую ловушку 
в общем обработчике. Этот обработчик прежде всего определяет, является ли ис- 
точником перехваченного запроса гостевая ОС, которой управляет гипервизор, 
чтобы определить желаемую операцию и эмулировать ее действие. 


Основным недостатком паравиртуализации является необходимость внесения из- 
менений в гостевую операционную систему и ее драйверы для реализации интер- 
фейса с гипервизором. Разработчики дистрибутивов основных операционных систем 
не проявили особого интереса к полной поддержке интерфейса паравиртуализации. 


Двоичная трансляция 


Одним из способов обработки проблемных инструкций в процессорных архитекту- 
рах, где отсутствует полная поддержка виртуализации, является обнаружение на- 
личия невиртуализуемых инструкций до их выполнения путем сканирования дво- 
ичного кода. При обнаружении таких инструкций код преобразуется в инструкции, 
допускающие виртуализацию и имеющие аналогичное действие. 


Такое решение оказалось популярным подходом к виртуализации в архитектуре 
х8б. Сочетание метода перехвата и эмуляции с двоичной трансляцией невиртуали- 
зируемых инструкций обеспечивает приемлемую производительность гостевой ОС. 
Этот метод снижает затраты на обработку, необходимую для обращения с невир- 
туализируемыми инструкциями, до допустимого уровня. 


Различают статическую и динамическую двоичную трансляцию. При статической 
двоичной трансляции набор исполняемых образов перекомпилируется в форму, 
готовую к выполнению в виртуальной среде. Для выполнения такой трансляции 
требуется некоторое время, но это однократный процесс, создающий набор систем- 
ных и пользовательских образов, которые можно использовать до тех пор, пока не 
будут установлены новые версии образов, что потребует перекомпиляции этих но- 
вых образов. 


При динамической двоичной трансляции сканирование секций кода для поиска про- 
блемных инструкций осуществляется во время выполнения программы. При обна- 
ружении таких инструкций они заменяются последовательностями виртуализуемых 
инструкций. Динамическая двоичная трансляция позволяет избежать этапа переком- 
пиляции, требуемого при статической трансляции, но вызывает снижение произво- 
дительности из-за непрерывного процесса сканирования и трансляции во время вы- 
полнения кода. Каждый сегмент кода необходимо сканировать и транслировать 
только один раз при каждом запуске программы, после этого он помещается в кеш. 
Например, код внутри цикла не будет повторно сканироваться на каждой итерации. 
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Эмуляция аппаратных средств 


Все методы виртуализации, которые мы обсуждали до этого момента, предполага- 
ли, что гостевая ОС будет работать на процессоре с той же архитектурой набора 
команд, что и у процессора хоста. Существует множество ситуаций, в которых же- 
лательно запускать операционную систему и код приложения на процессоре хоста с 
совершенно иной архитектурой набора команд (ЗА), чем в гостевой ОС. 


При эмуляции аппаратных средств процессора каждая инструкция, выполняемая в 
эмулируемой гостевой системе, должна быть преобразована в эквивалентную инст- 
рукцию или последовательность инструкций из [ЗА хоста. Как и в случае с двоич- 
ной трансляцией, для выполнения этого процесса можно использовать статический 
или динамический подход. 


» При статической трансляции можно создать эффективный исполняемый 
образ, способный работать в [ЗА целевого процессора. Применение статиче- 
ской трансляции сопряжено с некоторым риском, т. к. иногда непросто опре- 
делить все пути выполнения кода в исполняемом файле, особенно если целе- 
вые адреса ветвей вычисляются в коде, а не определены статически. Этот 
риск также применим к методу статической двоичной трансляции, описанно- 
му в предыдущем разделе. 


® Динамическая трансляция позволяет избежать потенциальных ошибок, ко- 
торые могут возникнуть при статической трансляции, но производительность 
при этом может значительно снизиться. Это обусловлено тем, что динамиче- 
ская трансляция с эмуляцией аппаратных средств включает в себя перевод 
каждой инструкции из одной архитектуры в другую. 


В этом она отличается от динамической двоичной трансляции для той же [5А, при 
которой также требуется сканировать каждую инструкцию, но трансляция обычно 
требуется только для небольшой части выполняемых инструкций. 


Одним из примеров инструментов эмуляции аппаратных средств является плат- 
форма эмуляции и виртуализации с открытым исходным кодом ОЕМО 
(6 р5://\у\у\".-дети.ог?/). ОЕМО позволяет с достаточно хорошей производитель- 
ностью запускать операционные системы для широкого спектра различных процес- 
сорных архитектур. 


Пакет Егеедот ЗаЧ10 для процессора В$С-У включает в себя реализацию ОЕМИ 
для архитектуры набора инструкций ВУ64СС. Мы использовали эту виртуализиро- 
ванную среду для выполнения кода в упражнениях главы 11. 


В следующем разделе мы обсудим проблемы и преимущества, связанные с виртуа- 
лизацией в процессорных архитектурах, рассмотренных в предыдущих главах. 


Проблемы виртуализации 


Говоря простыми словами, цель виртуализации процессора состоит в том, чтобы 
запустить операционную систему в гипервизоре, который либо работает непосред- 
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ственно на аппаратных средствах компьютерной системы, либо выполняется как 
приложение под управлением другой операционной системы. 


В этом разделе мы сосредоточимся на гипервизорах типа 2 (размещаемых поверх 
ОС), поскольку этот режим работы создает ряд дополнительных проблем, с кото- 
рыми аппаратные гипервизоры могут не встретиться, т. к. гипервизоры типа 1 
оптимизированы для поддержки виртуализации. 


В гипервизорах типа 2 операционная система хоста поддерживает режимы ядра и 
пользователя, как и гостевая операционная система (с ее точки зрения). Поскольку 
гостевая ОС и работающие в ней приложения обращаются к системным сервисам, 
гипервизор должен перехватывать каждый запрос и преобразовывать его в соответ- 
ствующий вызов операционной системы хоста. 


В невиртуализированной системе периферийные устройства, такие как клавиатура 
и мышь, напрямую взаимодействуют с операционной системой хоста. В виртуали- 
зированной среде гипервизор должен управлять интерфейсами с этими устройст- 
вами всякий раз, когда пользователь запрашивает взаимодействие с гостевой ОС. 


Уровень сложности, связанный с реализацией этих возможностей, зависит от набо- 
ра команд хоста. Даже если в наборе команд не были реализованы меры для облег- 
чения виртуализации, это не указывает на возможность или невозможность под- 
держки виртуализации в такой архитектуре прямолинейным способом. Легкость 
виртуализации в [ЗА конкретного процессора зависит от того, как процессор обра- 
батывает небезопасные инструкции. 


Небезопасные инструкции 


Название метода виртуализации с перехватом и эмуляцией относится к способно- 
сти гипервизора управлять обработкой исключений, которую обычно выполняют 
обработчики режима ядра в операционной системе хоста. Это позволяет гипервизо- 
ру обрабатывать нарушения привилегий и системные вызовы из гостевых операци- 
онных систем и приложений, которые выполняются в них. 


Каждый раз, когда приложение, запущенное в гостевой ОС, запрашивает систем- 
ную функцию, например открытие файла, гипервизор перехватывает этот запрос, 
корректирует его параметры в соответствии с конфигурацией виртуальной машины 
(возможно, перенаправляя запрос на открытие файла из файловой системы хоста в 
песочницу виртуального диска гостевой ОС) и передает скорректированный запрос 
в ОС хоста. Процесс проверки и обработки исключений гипервизором представляет 
собой фазу эмуляции подхода с перехватом и эмуляцией. 


В контексте виртуализации инструкции процессора, которые либо зависят от ин- 
формации о состоянии привилегированной системы, либо изменяют эту информа- 
цию, называются небезопасными. Для того чтобы метод перехвата и эмуляции ра- 
ботал безопасно и надежно, все небезопасные инструкции должны генерировать 
исключения, которые перехватывает гипервизор. Если разрешить выполнение не- 
безопасной инструкции без перехвата, то изоляция виртуальной машины будет на- 
рушена, и работа в режиме виртуализации может завершиться сбоем. 
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Как мы узнали из разд. "Виртуализация с перехватом и эмуляцией" этой главы, 
данной проблемой были затронуты ранние версии архитектуры х86. 


Теневые таблицы страниц 


Защищенные структуры данных, используемые при распределении и управлении 
виртуальной и физической памятью, представляют собой еще одну проблему для 
полной виртуализации. Ядро гостевой ОС предполагает, что оно имеет полный 
доступ к аппаратным средствам и структурам данных, связанным с системным 
блоком управления памяти (ММО). Гипервизор должен транслировать запросы гос- 
тевой ОС на выделение и освобождение памяти таким способом, который функ- 
ционально эквивалентен работе гостевой ОС непосредственно на физическом обо- 
рудовании. 


Особая проблема возникает в архитектуре х86, поскольку для правильной настрой- 
ки системы данные конфигурации таблиц страниц виртуальной памяти должны 
храниться в процессоре, но эта информация становится недоступной после ее со- 
хранения. Для того чтобы устранить эту проблему, гипервизор поддерживает соб- 
ственную копию данных конфигурации таблиц страниц, называемых теневыми 
таблицами страниц. 


Поскольку теневые таблицы страниц не являются фактическими таблицами стра- 
ниц, управляющими памятью для ОС хоста, гипервизору необходимо установить 
ограничения на доступ к областям памяти с теневыми таблицами страниц и пере- 
хватывать соответствующие запросы, когда гостевая ОС пытается получить доступ 
к своим таблицам страниц. 


Затем гипервизор эмулирует запрошенную операцию, взаимодействуя с физиче- 
ским ММО посредством отправления вызовов в ОС хоста. 


Использование теневых таблиц страниц приводит к значительному снижению про- 
изводительности и является одной из приоритетных задач при работе над усовер- 
шенствованиями аппаратной виртуализации. 


Безопасность 


В использовании гипервизора для виртуализации одного или нескольких гостевых 
приложений нет по существу ничего небезопасного. Однако важно понимать, какие 
дополнительные возможности открыты для злоумышленников, пытающихся про- 
никнуть в виртуализированную среду. 


Гостевая виртуальная машина предоставляет удаленным злоумышленникам, по су- 
ти, тот же набор уязвимостей, что и идентичная операционная система и набор 
приложений, запущенные непосредственно на физическом оборудовании. Гиперви- 
зор предоставляет дополнительный путь, который злоумышленник может попы- 
таться использовать в виртуализированной среде. 


Если злоумышленникам удастся проникнуть в гипервизор и взять его под контроль, 
они получат ПОЛНЫЙ доступ ко всем гостевым операционным системам, а также к 
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приложениям и данным, доступным из этих гостевых ОС. В этом сценарии госте- 
вые ОС открыты для доступа, т. к. они работают на более низком уровне привиле- 
гий, нежели гипервизор, который имеет полный контроль над ними. 


При внедрении виртуализации в контексте, который допускает публичный доступ, 
например для веб-хостинга, крайне важно, чтобы учетные данные, позволяющие 
получить доступ к гипервизорам, были строго ограничены небольшим числом со- 
трудников. Необходимо строго соблюдать все применимые меры защиты, чтобы 
предотвратить несанкционированный доступ к гипервизору. 


В следующем разделе мы рассмотрим некоторые основные технические аспекты 
виртуализации, реализованные в современных семействах процессоров. 


Виртуализация современных процессоров 


Аппаратные архитектуры большинства семейств процессоров общего назначения 
созрели до такой степени, что они полностью поддерживают выполнение виртуали- 
зированных гостевых операционных систем, по крайней мере, в своих наиболее 
продвинутых версиях. В следующих разделах кратко представлены возможности 
виртуализации, предоставляемые современными семействами процессоров общего 
назначения. 


Виртуализация процессоров х86 


В архитектуре х86 изначально не была предусмотрена поддержка выполнения вир- 
туализированных операционных систем. 


В результате в процессорах х86, начиная с самых ранних моделей и заканчивая се- 
рией Репнит, были реализованы наборы команд, содержащие несколько небезо- 
пасных и при этом неперехватываемых инструкций. Эти инструкции вызывали 
проблемы с виртуализацией благодаря тому, например, что позволяли гостевой 
операционной системе получать доступ к привилегированным регистрам, которые 
не содержали данных, соответствующих состоянию виртуальной машины. 


ТЕКУЩИЙ УРОВЕНЬ ПРИВИЛЕГИЙ И НЕБЕЗОПАСНЫЕ 
ИНСТРУКЦИИ х86 


В архитектуре х86б два младших бита регистра сегмента кода (соде 
зевтепё С$) содержат значение текущего уровия привилегий (сштег 

и риу|Пере 1еуе], СРГ.), определяющее активное в данный момент кольцо 
защиты. Значение СРГ. обычно равно нулю для кода ядра и трем для 
пользовательских приложений в невиртуализированной операционной 
системе. В большинстве реализаций гипервизора виртуальные машины 
выполняются на уровне СРТ. = 3, что приводит в процессе выполнения 
к перехвату многих небезопасных инструкций х86. 
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К сожалению, для первых пользователей виртуализации на х86, не все 
небезопасные инструкции х86 в процессорах Репйит вызывали пере- 
хват при выполнении на уровне СРГ = 3. 


Например, инструкция $14 позволяет непривилегированному коду считывать 6-байт- 
ное значение регистра таблицы дескрипторов прерываний (пепирЕ дезсирюг 
{аЫе герлуег, ТОТК) и сохранять его в местоположении, указанном в качестве опе- 
ранда. В одноядерном процессоре х86 есть только один регистр ОТК. 


Когда гостевая операционная система выполняет эту инструкцию, ОТК содержит 
данные, связанные с операционной системой хоста и отличающиеся от информа- 
ции, которую ожидает получить гостевая ОС. Это ведет к ошибочному выполне- 
нию гостевой операционной системы. 


Запись в ШТК физической системы возможна только для кода, работающего с 
СРГ. = 0. Когда гостевая ОС пытается выполнить запись в ШТК во время работы на 
уровне СРГ. =3, происходит нарушение привилегий, и гипервизор обрабатывает 
последовавшее исключение (ловушку), чтобы эмулировать операцию записи, вы- 
полняя вместо этого запись в теневой регистр. Теневой регистр — это просто место 
в памяти, выделенное гипервизором. 


Однако чтение из ШТЕ на уровне СРГ, = 3 разрешено. Программное обеспечение 
пользовательского режима может считывать значение ШТК, и перехват при этом 
не происходит. Без перехвата гипервизор не может обработать эту операцию чте- 
ния и вернуть данные из теневого регистра. Нростыми словами, запись в регистр 
ШТЕК является виртуализуемой операцией, в чтение из ОТК. — нет. 


Из сотен инструкций, включенных в архитектуру набора инструкций Репнит, 
17 были признаны небезопасными и при этом неперехватываемыми. Другими сло- 
вами, эти инструкции являются невиртуализируемыми. Таким образом, для архи- 
тектуры Репнит х86 реализация чистого подхода к виртуализации с перехватом и 
эмуляцией невозможна. 


Небезопасные и неперехватываемые инструкции часто используются в операцион- 
ных системах и драйверах устройств, но редко встречаются в коде приложений. 
Гипервизор должен реализовать механизм для обнаружения в коде небезопасных и 
неперехватываемых инструкций и их обработки. 


В нескольких популярных системах виртуализации был принят подход, сочетаю- 
щий виртуализацию с перехватом и эмуляцией, где это возможно, с двоичной 
трансляцией небезопасных инструкций в функционально эквивалентные последо- 
вательности кода, подходящие для виртуализированной среды. 


Большинство приложений для гостевых пользователей вообще не пытаются ис- 
пользовать небезопасные инструкции. Это позволяет им работать на полной скоро- 
сти, после того как гипервизор просканирует код, чтобы убедиться в отсутствии 
небезопасных инструкций. Однако код гостевого ядра может содержать многочис- 
ленные, часто встречающиеся небезопасные инструкции. Для достижения прием- 
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лемой производительности кода при использовании ДВОИЧНОЙ трансляции необхо- 
димо кешировать измененный код при его первом выполнении и повторно исполь- 
зовать кешированную версию при последующих проходах выполнения. 


Аппаратная виртуализация процессоров х86 


В 2005 и 2006 гг. пи и АМО выпустили версии процессоров х86, содержащие ап- 
паратные расширения, поддерживающие виртуализацию. 


Эти расширения разрешили проблемы, вызванные небезопасными и неперехваты- 
ваемыми инструкциями, обеспечив возможность полной виртуализации систем в 
соответствии с критериями Попека и Голдберга. Эти расширения получили назва- 
ния АМО-У в процессорах АМР и УТ-х в процессорах Пие|. Расширения виртуали- 
зации в современных процессорах ше! носят название УТ. 


Первоначальные реализации этих технологий аппаратной виртуализации устранили 
требования к двоичной трансляции небезопасных инструкций, но после исключе- 
ния двоичной трансляции общая производительность виртуальных машин сущест- 
венно не улучшилась. Это было связано с тем, что по-прежнему требовалось ис- 
пользовать теневые таблицы страниц, на долю которых приходилась большая часть 
снижения производительности, наблюдаемого во время работы виртуальных машин. 


В более поздних версиях технологии аппаратной виртуализации были устранены 
многие факторы снижения производительности при работе виртуальных машин, 
что привело к широкому внедрению виртуализации семейства х86 в различных об- 
ластях. Сегодня доступно множество инструментов и платформ для реализации 
решений виртуализации х86 различного масштаба — от автономной рабочей стан- 
ции до полностью управляемого центра обработки данных с поддержкой тысяч 
серверов, каждый из которых способен одновременно поддерживать работу не- 
скольких виртуальных машин. 


Виртуализация процессоров АКМ 


Архитектура АКМ поддерживает виртуализацию как в 32-разрядном, так и в 64-раз- 
рядном режиме. Аппаратная поддержка виртуализации в этой архитектуре включа- 
ет в себя следующие компоненты: 


» полнофункциональную виртуализацию с перехватом и эмуляцией; 
» выделенную категорию исключений для использования гипервизором;, 


»е дополнительные регистры, поддерживающие исключения гипервизора и ука- 
затели стека. 


Архитектура АКМ обеспечивает аппаратную поддержку трансляции запросов на 
доступ к памяти из гостевых операционных систем в адреса физической системы. 


Системы, работающие на процессорах АВМ, предлагают широкие возможности 
для выполнения виртуальных машин с использованием гипервизора типа | или 2. 
Производительность 64-разрядного процессора АВМ сопоставима с серверами х64 
с аналогичными характеристиками. Для многих областей применения, таких как 


Виртуализация процессоров 371 


развертывание крупных центров обработки данных, выбор между хб4 и АКМ в ка- 
честве серверного процессора может зависеть от факторов, не связанных с произ- 
водительностью процессора, таких как энергопотребление или требования к охла- 
ждению. 


Виртуализация процессоров В1$С-У 


В отличие от других архитектур набора инструкций (ГЗА), рассмотренных в этой 
главе, в [ЗА В]$С-У всесторонняя поддержка виртуализации была базовым требо- 
ванием с самого начала процесса проектирования. Расширение В!$С-У для реали- 
зации гипервизора предоставляет полный набор возможностей для поддержки ги- 
первизоров обоих типов. 


В этом расширении К1$С-У полностью реализован метод виртуализации с перехва- 
том и эмуляцией и обеспечена аппаратная поддержка трансляции физических адре- 
сов гостевой операционной системы в физические адреса хоста. 


В КТ5С-У реализована концепция приоритетного и фонового управления и регист- 
ров состояния, которая позволяет быстро переключать регистры супервизора в ра- 
бочее состояние и из него по мере перехода виртуальных машин в состояние вы- 
полнения и из него. 


Каждый аппаратный поток в К1$С-У выполняется на одном из трех уровней приви- 
легий: 


е пользователь (0) — то же самое, что и привилегии пользователя в традици- 
онной операционной системе; 


» супервизор (5) — то же самое, что и режим супервизора или ядра в традици- 
онной операционной системе; 


е машина (М) — наивысший уровень привилегий с доступом ко всем функци- 
ям системы. 


Некоторые процессоры могут реализовывать все три режима, другие — лишь два 
из них, Ми О, третьи — только режим М. Иные комбинации не допускаются. 


В процессоре ВТ$С-У, поддерживающем расширение гипервизора, режимом вир- 
туализации управляет дополнительный бит конфигурации — бит У. Для аппарат- 
ных потоков, выполняющихся в виртуализированной гостевой системе, бит У уста- 
новлен в состояние 1. Если бит У имеет значение 1, доступны уровни привилегий 
как пользователя, так и супервизора. Эти уровни называют режимом виртуального 
пользователя (уиа| изег, УЦ) и режимом виртуального супервизора (у1ла| 51- 
регу1зог, УЗ). 


В контексте гипервизора В1$С-У режим супервизора с битом У, равным 0, пере- 
именован в режим гипервизора — расширенного супервизора (Нурегу1ог- 
ежеп4де4 Зирегу15ог тоде, НЗ). Это название указывает на то, что Н$ — это режим, 
в котором работает сам гипервизор, независимо от его типа (1 или 2). Оставшийся 
уровень привилегий М действует только в невиртуализированном режиме при 
У = 0. 
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В режимах УП и У$ процессор ВТ$С-У реализует двухуровневую схему трансля- 
ции адресов для преобразования каждого виртуального адреса гостевой ОС сначала 
в ее физический адрес, а затем в физический адрес супервизора. Эта процедура 
обеспечивает эффективную трансляцию виртуальных адресов в приложениях, за- 
пущенных в гостевых операционных системах, в физические адреса в системной 
памяти. 


В следующем разделе представлены обзоры нескольких популярных инструментов 
для виртуализации процессоров и операционных систем. 


Инструменты виртуализации 


В этом разделе мы рассмотрим несколько широко доступных инструментов с от- 
крытым исходным кодом и коммерческих инструментов, которые реализуют раз- 
личные формы виртуализации процессоров. Эта информация может быть полезна в 
качестве отправной точки в начале работы над проектом, связанным с виртуализа- 
цией. 


УпчиаВох 


Упта]Вох — это бесплатный гипервизор типа 2 с открытым исходным кодом от 
корпорации Огасе. Поддерживаемые операционные системы хоста — У/тдо\з и 
несколько дистрибутивов Глпих. Одна или несколько гостевых операционных сис- 
тем на одном хосте могут одновременно запускать \/т4о\з, тасО$, Зо]а11, Ореп 
Зоапз и различные дистрибутивы Глпих. 


ТРЕБОВАНИЯ К ЛИЦЕНЗИРОВАНИЮ ГОСТЕВЫХ ОС 


торском праве, операционные системы, требующие лицензирования, 
такие как \//пдо\$, должны иметь действующие лицензии даже при 
запуске в качестве гостевых операционных систем. 


и Для того чтобы организации и частные лица соблюдали законы об ав- 


Отдельные виртуальные машины можно запускать, останавливать и приостанавли- 
вать под управлением интерактивной программы управления УшиаВох или из ко- 
мандной строки. Ушша!Вох позволяет делать моментальные снимки выполняю- 
щихся виртуальных машин и сохранять их на диск. Впоследствии с помощью 
сохраненного моментального снимка можно возобновить выполнение машины с 
той точки, в которой был сделан этот снимок. 


Ушша]Вох требует аппаратной виртуализации, предоставляемой платформами с 
расширениями АМО-У или ше УТ. Предусмотрено множество механизмов, с по- 
мощью которых виртуальные машины могут взаимодействовать с ОС хоста и друг 


с другом. 
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Общий буфер обмена поддерживает операции копирования-вставки между хостом 
и гостевой машиной, а также между гостевыми машинами. В УшиаВох можно на- 
строить внутреннюю сеть, чтобы гостевые ОС могли взаимодействовать друг с 
другом так, как если бы они были подключены к изолированной локальной сети. 


УМуаге У/!огКк$аНоп 


ПО УМ\уаге Уогк$анНоп, первая версия которого была выпущена в 1999 г., — это 
гипервизор типа 2, который работает на 64-разрядных версиях \/т40\$ и Глпих. 
Продукты УМу’аге предлагаются на коммерческой основе и требуют приобретения 
лицензий некоторыми пользователями. 


Версия УМ\уаге \МотгКЯаНоп под названием УМ\’аге Уогк$аНоп Р]ауег доступна 
бесплатно с условием, что она будет использоваться только в некоммерческих целях. 


УМугаге \огКк$аНоп поддерживает выполнение (возможно) нескольких копий опе- 
рационных систем У/1т4о\$, Глпих и М$-ОО$ в операционной системе Глпих или 
УЛпао\$ хоста. Как и УшиаВох, УМуаге У/огК%айоп может создавать моменталь- 
ные снимки состояния виртуальной машины, сохранять эту информацию на диск и 
позже возобновлять выполнение, начиная с момента создания снимка. УМууаге 
Уогк$аНоп также поддерживает функции связи между хостом и гостевой системой 
и между самими гостевыми системами, такие как общий буфер обмена и эмуляция 
локальной сети. 


\УМугаге ЕЗХ! 


ЕЗХ!1 — это гипервизор типа 1, предназначенный для развертывания систем корпо- 
ративного класса в центрах обработки данных и фермах облачных серверов. Как 
гипервизор типа 1, ЕЗХ! работает на физическом оборудовании хоста. Он имеет 
интерфейсы с аппаратными средствами компьютерной системы, каждой гостевой 
операционной системой и интерфейсом управления, называемым консолью обслу- 
живания. 


С консоли обслуживания администраторы могут осуществлять контроль и управ- 
ление работой крупномасштабного центра обработки данных, вызывая виртуаль- 
ные машины и назначая им задачи (называемые рабочими нагрузками). 


ЕЗХ! предоставляет дополнительные функции, необходимые для крупномасштаб- 
ных развертываний, такие как мониторинг производительности и обнаружение не- 
исправностей. В случае аппаратного сбоя или для обслуживания системы рабочие 
нагрузки виртуальных машин можно легко перенести на другие хосты. 


КУМ 


Кете!-Базеда Ушиа| Маспте (КУМ) — это гипервизор типа 2 с открытым исход- 
ным кодом, первая версия которого была выпущена в 2007 г. КУМ поддерживает 
полную виртуализацию для гостевых операционных систем. При использовании с 
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хостами х86 или хб4 системные аппаратные средства должны включать расширение 
виртуализации АМО-У или шп] УТ. Ядро гипервизора КУМ включено в основную 
линейку разработки [лпих. 


КУМ поддерживает выполнение одного или нескольких виртуализированных эк- 
земпляров Глпих и \/1140\5$ на хосте без какой-либо модификации гостевых опера- 
ционных систем. 


Изначально КУМ был разработан для 32-разрядной архитектуры х86, однако впо- 
следствии он был перенесен на хб4, АКМ и Ро\егРС. КУМ поддерживает паравир- 
туализацию для гостевых систем Глпих и \!1140\з с использованием Упиво АР. 
В этом режиме данное решение предоставляет паравиртуализированные драйверы 
устройств для Ефегтеф, дискового ввода-вывода и графического дисплея. 


Хеп 


Первая версия Хеп, бесплатного гипервизора типа | с открытым исходным кодом, 
была выпущена в 2003 г. Текущая версия Хеп работает на процессорах х86, хб4 и 
АВМ. Хеп поддерживает гостевые виртуальные машины, работающие под управ- 
лением аппаратной виртуализации (АМО-У или ше УТ) или в качестве паравир- 
туализированных операционных систем. Хеп реализован в основной ветви ядра 
Глпох. 


Гипервизор Хеп запускает одну виртуальную машину на самом привилегирован- 
ном уровне, называемом доменом 0 или 4от0. Виртуальная машина 4от0 обычно 
является вариантом Глпих и имеет полный доступ к системным аппаратным средст- 
вам. Машина 4от0 предоставляет пользовательский интерфейс для управления ги- 
первизором. 


Некоторые из крупнейших коммерческих поставщиков облачных услуг, включая 
Ататоп ЕС2, [ВМ ЗоЁГауег и КасКзрасе С]оч4, используют Хеп в качестве своей 
основной гипервизорной платформы. 


Хеп поддерживает функцию динамического переноса, благодаря которой вирту- 
альную машину можно перенести с одной хост-платформы на другую без останов- 
ки ее работы. 


ОЕМО 


ОЕМО (от англ. Ошск ЕМО]Лаюг — быстрый эмулятор) — это бесплатный эмулятор 
с открытым исходным кодом, который реализует аппаратную виртуализацию. 
ОЕМИЧ может выполнять эмуляцию на уровне отдельного приложения или всей 
компьютерной системы. На уровне приложений ОЕМП может запускать отдельные 
приложения пах или тасО$, которые были созданы для архитектуры [ЗА, отлич- 
ной от [ЗА среды выполнения. 


При эмуляции системы ОЕМИУ представляет собой законченную компьютерную 
систему, включая периферийные устройства. 
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ОЕМО поддерживает одновременное выполнение нескольких гостевых операцион- 
ных систем на одном хосте. Поддерживаемые 1ЗА: х86, МПР$, АКМУ7, АКМУЗ, 
Ро\уегРС, Зрагс, А1рВа, ОрепК1$С и ВТ5С-У. 


ОЕМО поддерживает настройку и перенос машин КУМ, выполняя аппаратную 
эмуляцию совместно с виртуальной машиной, работающей под управлением КУМ. 
Аналогичным образом ОЕМО может обеспечить аппаратную эмуляцию для вирту- 
альных машин, работающих под управлением Хеп. 


Среди прочих инструментов виртуализации ОЕМИ уникален тем, что ему не тре- 
буется запуск с повышенными привилегиями, поскольку он полностью эмулирует 
гостевую систему в программном обеспечении. Недостатком такого подхода явля- 
ется снижение производительности, обусловленное процессом эмуляции про- 
граммного обеспечения. 


В следующем разделе мы обсудим синергетические эффекты, возникающие в ре- 
зультате использования виртуализации в среде облачных вычислений. 


Виртуализация и облачные вычисления 


Термины "виртуализация" и "облачные вычисления" часто употребляют с размы- 
тыми, иногда перекрывающими друг друга значениями. Разницу между ними мож- 
но определить следующим образом: 


» виртуализация — это технология абстрагирования программных систем от 
среды, в которой они работают; 


» облачные вычисления — это методология использования виртуализации и 
других технологий для обеспечения развертывания, мониторинга и управле- 
ния крупными центрами обработки данных. 


Использование виртуализации в средах облачных вычислений позволяет гибко раз- 
вертывать рабочие нагрузки приложений в крупных парках универсального вычис- 
лительного оборудования контролируемым и согласованным образом. Размещая 
такие приложения, как веб-серверы, в виртуальных машинах, можно динамически 
масштабировать доступные вычислительные мощности в соответствии с изменяю- 
щимися условиями загрузки. 


Коммерческие поставщики облачных услуг, как правило, предлагают использовать 
свои системы с оплатой за фактическое использование ресурсов. Посещаемость 
веб-сайта с обычно небольшим объемом трафика может резко вырасти, если, на- 
пример, он будет упомянут в национальной программе новостей. Если сайт развер- 
нут в масштабируемой облачной среде, управляющее ПО обнаружит увеличение 
нагрузки и запустит дополнительные экземпляры этого веб-сайта и, возможно, сер- 
верной базы данных. 


Такое повышенное потребление ресурсов приведет к увеличению счета, выстав- 
ляемого поставщиком облачных услуг, который большинство компаний с радостью 
оплатят, если в результате их веб-сайт сохранит работоспособность и будет нор- 
мально реагировать на ввод данных пользователем даже при значительной нагрузке. 
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Среды управления облачными ресурсами, такие как УМугаге ЕЗХ! и Хеп, предос- 
тавляют комплексные инструменты для настройки, развертывания, управления и 
обслуживания крупномасштабных облачных операций. Такие конфигурации могут 
быть предназначены для локального использования отдельной организацией или 
могут предлагать общедоступные ресурсы для поставщиков онлайн-услуг, таких 
как Ата7топ У/еБ Зегусез. 


Потребление электроэнергии 


Для поставщиков облачных услуг плата за потребленную электроэнергию относит- 
ся к значительным расходам. Каждый включенный компьютер в крупной серверной 
ферме потребляет электроэнергию, даже если он не выполняет никакой полезной 
работы. Для инфраструктуры, содержащей тысячи компьютеров, важно, чтобы сер- 
веры потребляли электроэнергию только тогда, когда это необходимо оплачиваю- 
щим их услуги клиентам. 


Виртуализация существенно помогает в эффективном использовании серверных 
систем. 


Поскольку на одном сервере можно разместить несколько гостевых виртуальных 
машин, рабочие нагрузки клиентов могут быть эффективно распределены по сер- 
верному оборудованию таким образом, чтобы избежать низкой загрузки доступных 
компьютеров. Серверы, которые не нужны в данный момент, можно выключить, 
чтобы снизить потребление электроэнергии, что, в свою очередь, уменьшает затра- 
ты поставщика облачных услуг и обеспечивает более конкурентоспособные цены 
для конечных пользователей. 


В этом разделе представлено лишь краткое введение в использование виртуализа- 
ции в контексте облачных вычислений. Большинство организаций и частных лиц, 
имеющих представительство в Интернете, используют виртуальные серверы в сре- 
де облачных вычислений, независимо от того, знают они об этом или нет. 


Резюме 


В этой главе были представлены концепции, заложенные в основу виртуализации 
процессоров, и объяснены многочисленные преимущества. ее эффективного ис- 
пользования для отдельных пользователей и крупных организаций. Мы рассмотре- 
ли основные методы виртуализации, а также инструменты, которые их реализу- 
ют, — как коммерческие, так и с открытым исходным кодом. 


Мы также ознакомились с преимуществами виртуализации при развертывании ре- 
альных программных приложений в облачных средах. 


Теперь вы должны хорошо разбираться в технологиях виртуализации процессоров 
и предлагаемых ими преимуществах, а также в том, как 1ЗА современных процес- 
соров поддерживают виртуализацию на уровне набора инструкций. Мы рассмотре- 
ли несколько инструментов с открытым исходным кодом и коммерческих инстру- 
ментов, предоставляющих возможности виртуализации. Теперь вы понимаете, как 
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можно использовать виртуализацию для создания и развертывания масштабируе- 
мых приложений в средах облачных вычислений. 


В следующей главе мы рассмотрим архитектуру решений для нескольких катего- 
рий применения, включая мобильные устройства, персональные компьютеры, иг- 
ровые системы, системы для обработки больших данных и нейронные сети. 


Упражнения 


1. Скачайте и установите текущую версию Ушта!Вох. Скачайте, установите и за- 
пустите Оби Глпих в качестве виртуальной машины в УшиаВох. Подключи- 
те гостевую ОС к Интернету с помощью мостового сетевого адаптера. Настрой- 
те и включите общий доступ к буферу обмена и файлам между гостевой 
системой ОБип и операционной системой хоста. 


2. В операционной системе ОБипыа, которую вы установили в упражнении Г, уста- 
новите УшиаВох, затем установите и запустите версию виртуальной машины 
Егее)О$, которую можно найти по адресу ВИрз://уу\у\. ФгееЧ0$.ог?/4о\ушюа4/. 


Убедитесь в правильности выполнения команд ОО$5, таких как еспо Не11о мог1а! 
и тет, в виртуальной машине ЕгеедО$. Выполнение этого упражнения означает, 
что вы реализовали экземпляр вложенной виртуализации. 


3. Создайте две отдельные копии гостевой машины ОБбищи в среде хоста 
Ушша|Вох. Настройте обе гостевые системы ОБип@ для подключения к внут- 
ренней сети УшиаВох. Задайте в этих двух машинах совместимые [Р-адреса. 
Убедитесь, что каждая машина может получить ответ от другой, используя ко- 
манду р1пе. Выполнение этого упражнения означает, что вы настроили в своей 
виртуализированной среде виртуальную сеть. 
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Специализированные 
компьютерные архитектуры 


В этой главе собраны воедино темы, обсуждавшиеся в предыдущих главах, по- 
скольку здесь мы рассмотрим архитектуры различных компьютерных систем, раз- 
работанных для реализации уникальных требований пользователей. Мы разберемся 
в требованиях на уровне пользователя и функциональных возможностях, относя- 
щихся к нескольким категориям реальных компьютерных систем. 


В этой главе будут рассмотрены следующие темы: 


» проектирование архитектуры компьютерных систем на основе уникальных 
требований; 


®е архитектура смартфона; 

» архитектура персонального компьютера; 

»® вычислительная архитектура масштаба ЦОД (центра обработки данных); 
» архитектура процессоров для нейронных сетей и машинного обучения. 


Эта глава поможет вам разобраться в процессе принятия решений при определении 
компьютерных архитектур, которые должны обеспечить поддержку конкретных 
потребностей. Вы ознакомитесь с ключевыми требованиями, определяющими ар- 
хитектуру мобильных устройств, персональных компьютеров, облачных серверных 
систем, нейронных сетей и других средств машинного обучения. 


Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 
В@рз://оИВоБ.сот/РасКЕРи 65 то/Модегп-Сотрщег-Агспесиге-апд- 
ОтраштаНоп-Зесопд-ЕЗ1 оп. 
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Проектирование архитектуры компьютерных 
систем на основе уникальных требований 


Каждое устройство, содержащее цифровой процессор, предназначено для выполне- 
ния определенной функции или набора функций. К подобным устройствам отно- 
сятся устройства общего назначения, такие как персональные компьютеры. Исход- 
ную информацию для начала проектирования архитектуры цифровых компонентов 
конкретного устройства или компьютерной системы содержит общий перечень 
всех необходимых и желаемых функций и возможностей. 


Некоторые соображения, которые разработчик архитектуры компьютеров должен 
учитывать в процессе проектирования цифровой системы, приведены в следующем 
списке. 


е Типы требуемой обработки. Должно ли устройство обрабатывать аудио, 
видео или другую аналоговую информацию? Включен ли в проект графиче- 
ский дисплей высокого разрешения? Потребуется ли обширное применение 
арифметики с плавающей запятой или с целыми числами? Должна ли система 
поддерживать работу нескольких одновременно запущенных приложений? 
Будут ли использоваться специальные алгоритмы, такие как обработка с по- 
мощью нейронных сетей? 


» Требования к памяти и хранилищу. Какой объем оперативной памяти по- 
требуется операционной системе и предполагаемым пользовательским при- 
ложениям для надлежащей работы? Какой объем энергонезависимого храни- 
лища потребуется? 


» Система жесткого или мягкого реального времени. Является ли обяза- 
тельным реагирование на входные данные в реальном времени в течение 
определенного срока? Если работа в реальном времени не является абсолют- 
ным требованием, существует ли желаемое время отклика, которое должно 
соблюдаться большую часть времени (но не постоянно)? 


» Требования к подключению. Какие типы проводных подключений, таких 
как Ефете и ОЗВ, должно поддерживать устройство? Сколько физических 
портов требуется для подключения каждого типа? Какие типы беспроводных 
подключений (сотовая сеть, \/1-Е1, Вмеюо, МЕС, СР® и т. д.) необходимы? 


» Энергопотребление. Использует ли устройство аккумуляторное питание? 
Если да, то каков допустимый уровень энергопотребления компонентов циф- 
ровой системы в периоды ее интенсивного использования, а также в периоды 
простоя? Если система работает от внешнего источника питания, что для нее 
важнее — высокая производительность обработки или низкое энергопотреб- 
ление? Для систем с аккумуляторным питанием и систем с внешним питани- 
ем — каковы пределы рассеивания мощности, после превышения которых 
перегрев становится проблемой? 
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» Физические ограничения. Существуют ли жесткие ограничения на размер 
компонентов цифровой обработки? Существует ли ограничение по массе 
системы? 


е Ограничения по условиям окружающей среды. Должно ли устройство 
быть рассчитано на работу при крайне высоких или низких температурах? 
Какой уровень вибрации и ударных воздействий должно выдерживать уст- 
ройство? Должно ли устройство работать в условиях повышенной влажности, 
сухости или запыленности атмосферы? Будет ли устройство подвергаться 
воздействию соленой воды или радиации в космосе? 


В следующих разделах рассматриваются общие архитектуры цифровых устройств 
нескольких категорий и обсуждаются ответы, к которым пришли архитекторы этих 
систем, отвечая на вопросы, подобные тем, что приведены выше. Мы начнем с ар- 
хитектуры мобильных устройств, обратив особое внимание на 1РБопе 13 Рго Мах. 


Архитектура смартфона 


Для того чтобы получить широкое признание, смартфон должен обладать тремя 
ключевыми характеристиками на уровне архитектуры: небольшие размеры (за ис- 
ключением дисплея), длительное время автономной работы и очень высокая произ- 
водительность обработки по требованию. Очевидно, что требования длительного 
времени автономной работы и высокой вычислительной мощности противоречат 
друг другу и должны быть сбалансированы для получения оптимального решения. 


Требование небольших размеров обычно удовлетворяют, начиная с оценки размера 
экрана (по высоте и ширине), который должен быть достаточно большим для ото- 
бражения высококачественного видео и выполнения функций устройства пользова- 
тельского ввода (особенно в качестве клавиатуры), но при этом устройство должно 
быть достаточно компактным, чтобы е о можно было легко носить в кармане или 
сумочке. Для того чтобы сохранить небольшой размер устройства с точки зрения 
общего объема, оно должно быть как можно более тонким. 


В стремлении к тонкому профилю конструкция механической части должна обес- 
печивать достаточную прочность, чтобы удерживать экран и противостоять повре- 
ждениям при обычном обращении, падениях на пол и других физических воздейст- 
виях, одновременно оставляя достаточно места для аккумулятора, цифровых 
компонентов и подсистем, таких как приемопередатчик сотовой связи. 


Поскольку пользователи будут иметь неограниченный доступ к внешним и внут- 
ренним компонентам своих телефонов, любые коммерческие секреты или другая 
интеллектуальная собственность, такие как встроенное программное обеспечение 
системы, которые изготовитель желает сохранить в тайне, должны быть защищены 
от всех возможных способов извлечения. Тем не менее даже при наличии подоб- 
ных средств защиты конечным пользователям должна быть обеспечена возмож- 
ность простой и безопасной установки обновлений встроенного ПО с одновремен- 
ной блокировкой установки неавторизованных образов встроенного ПО. 
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В следующем разделе мы рассмотрим цифровую архитектуру современного смарт- 
фона высокого класса в контексте этих требований. 


'РБопе 13 Рго Мах 


1РВопе 13 Рго Мах был выпущен в сентябре 2021 г. На момент своего выпуска он 
был флагманским смартфоном Арре и совмещал в себе ряд самых передовых тех- 
нологий на рынке. 


Поскольку Арр!е публикует лишь ограниченную информацию о дета- 

и лях устройства своих изделий, некоторые из приведенных ниже сведе- 

\^ ний получены в результате разборки и других видов анализа обозрева- 

телями 1Рвопе 13 Рго Мах, и поэтому к ним следует отнестись с 
определенной долей скептицизма. 


В основе вычислительной архитектуры 1РВопе 13 Рго Мах — система на кристалле 
(50С) Арре А15 В1омс с шестиядерным процессором АКМУВ, состоящим из 
15 млрд КМОП-транзисторов. Два ядра с архитектурой под кодовым названием 
АузапсВе оптимизированы для работы с высокой производительностью и поддер- 
живают максимальную тактовую частоту 3,23 ГГц. Остальные четыре ядра под ко- 
довым названием ВП7таг4 предназначены для экономичной работы на частоте до 
1,82 ГГц. Все шесть ядер представляют собой суперскалярные конструкции с вне- 
очередным выполнением инструкций. При одновременном выполнении нескольких 
процессов или нескольких потоков в рамках одного процесса возможна параллель- 
ная работа всех шести ядер. 


Конечно, одновременная работа шести ядер приводит к значительному расходу 
энергии. Большую часть времени, особенно когда пользователь не взаимодействует 
с устройством, несколько ядер переводятся в режимы с низким энергопотреблени- 
ем, чтобы максимально увеличить время автономной работы. 


1РВопе 13 Рго Мах содержит до 8 Гбайт оперативной памяти четвертого поколения 
с пониженным энергопотреблением и удвоенной скоростью передачи данных 
(1о\у/-ро\муег 4Чоц Ме даа гме КАМ, ГР-ООВ4х). Каждое устройство ГР-ООВ4х под- 
держивает скорость передачи данных 4266 Мбит/с. Усовершенствование, на кото- 
рое указывает буква х в названии ГР-ООК4х, уменьшает напряжение сигнала вво- 
да-вывода с 1,1 В в предыдущем поколении РОК (ГР-ООКА4) до 0,6 В в ГР-ООКА4х, 
снижая энергопотребление оперативной памяти. 


В систему на кристалле А15 интегрирован пятиядерный графический процессор 
(СРО), разработанный АррЕ. В дополнение к ускорению решения традиционных 
задач СРО, таких как визуализация трехмерных сцен, в этом графическом процес- 
соре реализовано несколько улучшений, обеспечивающих поддержку машинного 
обучения и других задач параллельной обработки данных, подходящих для реали- 
зации на аппаратных средствах ОРО. 
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Процесс ЗО-визуализации основан на алгоритме отложенного рендеринга на о0с- 
нове плиток (1е-Базе4 4еРете гепдегпг?, ТВОК), адаптированном для систем с 
ограниченными ресурсами, таких как смартфоны. В процессе рендеринга алгоритм 
ТВОК пытается как можно раньше идентифицировать невидимые в поле зрения 
объекты (Т. е. те, которые заслонены другими объектами), чтобы исключить работу 
по их отрисовке. Этот процесс разделяет изображение на элементы (плитки) и для 
достижения максимальной производительности выполняет алгоритм ТВОК для не- 
скольких плиток параллельно. 


А15 содержит нейронный процессор под названием Арре Мешга! Епотше. Он имеет 
16 ядер, способных выполнять в общей сложности 15,8 трлн операций в секунду. 
Данная подсистема, по-видимому, используется для таких задач, как выявление и 
отслеживание объектов в видеопотоке, поступающем в реальном времени с камер 
телефона. 


А15 содержит сопроцессор движения. Это отдельный процессор АВМ, предназна- 
ченный для сбора и обработки данных, поступающих от гироскопа, акселерометра, 
компаса и барометрических датчиков телефона. Результат обработки этих данных 
представляет собой оценочную категорию текущей активности пользователя, та- 
кую как ходьба, бег, сон или вождение автомобиля. Сбор и обработка данных с 
датчиков продолжается и при низком уровне энергопотребления, когда остальная 
часть телефона находится в спящем режиме. 


Система А15, полностью соответствующая термину "система на кристалле", также 
содержит высокопроизводительный контроллер твердотельного накопителя 
(5014-5ме 4пуе, 350), который управляет доступом к внутреннему хранилищу 
объемом до 1 Тбайт. В качестве интерфейса между А15 и флеш-памятью использу- 
ется РСТ Ехрге$$. 


На рис. 13.1 показаны основные компоненты 1РВопе 13 Рго Мах. 


Аккумулятор Е Сенсорный Динамическое ОЗУ 
[Аенууитор | | докюй | экран ЕР-ОБОВ-4х до 8 Гбайт 


Беспроводная 
зарядка 


Твердотельный 
накопитель до 1 Тбайт 


Система на кристалле 


ее Навигационный 
‚АЗ Вюпс 


приемник 


Сотовая 


радиосистема 56 
звука камера |-Ё 


Рис. 13.1. Компоненты /РВопе 13 Рго Мах 
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1РВопе 13 Рго Мах содержит несколько высокоэффективных подсистем, описанных 


в табл. 13.1. 


Подсистема 


Аккумулятор 


Дисплей 


Сенсорный экран 


Несколько камер, 
ИК-излучатель, 
ИК-камера 


Беспроводная за- 
рядка 


Навигационные 
приемники 


Радиосистема со- 
ТОВОЙ СВЯЗИ 


Таблица 13.1. Подсистемы {Р®Попе 13 Рго Мах 


1Рвопе 13 Рго Мах содержит аккумулятор емкостью 3095 миллиам- 
пер-часов (мА-ч) 


Плоскопанельный дисплей с диагональю 6,1 дюйма (155 мм) и раз- 
решением 2532 х 1170 пикселов. Дисплей изготовлен по технологии, 
основанной на органических светодиодах (ограшс 12-етийпе 1- 
оде, ОГЕО), где слово "органический" указывает на использование 
органических соединений в люминесцентном материале 


Для обнаружения прикосновений в дисплей встроены емкостные 
датчики. Они обнаруживают изменение емкости, возникающее в ре- 
зультате приближения к ним проводящего объекта, такого как чело- 
веческий палец. После фильтрации и обработки исходных измерений 
датчиков можно определить точные местоположения нескольких 
точек одновременных касаний экрана. Кроме того, датчики измеряют 
давление, прилагаемое при прикосновении к экрану. Это позволяет 
программам по-разному реагировать на жесткие и мягкие нажатия 

на экран 


Каждая из трех задних камер создает изображения размером 

12 мегапикселов (Мп). Одна камера имеет стандартный объектив, 
вторая — телеобъектив, третья — сверхширокоугольный объектив. 
Эти камеры способны записывать видео в формате 4К (3840 х 2160 
пикселов) с частотой до 60 кадров в секунду (кадр/с) или 1080р 
(1920 х 1080 пикселов) с частотой до 240 кадр/с. Передняя камера 
разрешением 12 Мп записывает видео в формате 4К. с частотой 

60 кадр/с. 


Передняя панель 1РЮопе 13 Рго Мах содержит отдельный инфра- 
красный (ИК) лидарный датчик, поддерживающий распознавание 
лиц. Эта функция использует ИК-излучатель для подсветки 30 000 
точек, которые генерируют трехмерную карту лица пользователя. 
Телефон использует эту карту для проверки личности пользователя 
и снятия блокировки при подтверждении соответствия 


1Рвопе 13 Рго Мах поддерживает функции беспроводной зарядки 
Арре МарЗаЁе мощностью до 15 Вт и @1 мощностью до 7,5 Вт 


1РВопе 13 Рго Мах оснащен приемниками сигналов спутниковых 
навигационных систем С1оБа! Розвоптше Зу$ет (СР5), ГЛОНАСС, 
СаШео, Оца$1-ЛепИВ ЗаеИе Зует (0755) и Веои 


1Рвопе 13 Рго Мах содержит модем сотовой радиосвязи пятого поко- 
ления (5С) 
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Подсистема 


\М1-Е! и Вшеюош — |1РВопе 13 Рго Мах содержит интерфейс \!1-Е!1, поддерживающий 
стандарт \!1-Е1 6 (802.1 1ах) с технологией 2х2 ММО. Технология 
2х2 ММО использует две передающие и две приемные антенны для 
исключения пропадания сигнала. Интерфейс Вмеюо поддерживает 
версию 5.0 стандарта Виеюой 


Усилитель звука, | Усилитель звука в 1Рвопе 13 Рго Мах потребляет крайне мало энергии 
вибромотор в режиме ожидания и обеспечивает высокую эффективность и пре- 
восходное качество звука во время работы. 


Вибрация создается устройством тактильного отклика — линей- 
ным вибратором, способным генерировать различные тактильные 
сигналы обратной связи с пользователем 


1РВопе 13 Рго Мах объединил в себе самые передовые, компактные и легкие мо- 
бильные электронные технологии, доступные на момент его разработки, с изящным 
и привлекательным корпусом, став флагманским продуктом линейки смартфонов 
Арр/е. 


Далее мы рассмотрим архитектуру высокопроизводительного персонального ком- 
пьютера. 


Архитектура персонального компьютера 


Следующая система, которую мы рассмотрим, — это игровой ПК с процессором, 
который на момент написания статьи (в конце 2021 г.) был лидером по производи- 
тельности. Мы подробно рассмотрим процессор системы, графический процессор и 
основные подсистемы компьютера. 


Игровой настольный компьютер 
А[епуаге Аигога Кухеп ЕЧ\оп В1О 


Настольный ПК АНепуаге Аигога Кухеп Еашоп К10 был разработан с целью обес- 
печить максимальную производительность для игровых приложений. Для достиже- 
ния высокой скорости архитектура этой системы построена на основе самых быстрых 
компонентов — центрального процессора, графического процессора, подсистем 
оперативной и дисковой памяти, предлагаемых по цене, которую могут позволить 
себе как минимум некоторые серьезные геймеры и другие пользователи, ценящие 
высокую производительность. Однако количество покупателей, интересующихся 
высокопроизводительными элементами конфигурации, описанными в этом разделе, 
вероятно, будет ограничено их стоимостью, которая составляет более 4000 долла- 
ров США. 
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Апгога Вутеп Е4оп К10 комплектуется различными процессорами АМО Вугеп с 
разным уровнем производительности и ценой. В настоящее время самым произво- 
дительным процессором для этой платформы является АМО Вугеп 9 5950Х, выпу- 
щенный в ноябре 2020 г. 


Ву7еп 9 5950Х реализует 64-разрядную [ЗА в суперскалярной архитектуре с вне- 
очередным выполнением инструкций, упреждением и переименованием регистров. 
Согласно предоставленным АМО данным, микроархитектура ХГеп 3 процессора 
5950Х имеет показатель производительности, выраженный в количестве инструк- 
ций за такт процессора (шзбасНоп$ рег с1оск, [РС) на 19% выше, чем у микроар- 
хитектуры АМО предыдущего поколения (еп 2). 


Процессор Ву7еп 9 5950Х имеет следующие особенности: 
е 16 ядер; 
» 2 потока на процессор (в общей сложности 32 одновременных потока); 
» базовая тактовая частота 3,4 ГГц с пиковой частотой 4,9 ГГц при разгоне; 


» кеш-память инструкций уровня [1.1 на 32 Кбайт с 8-канальной ассоциативно- 
стью для каждого ядра; 


» кеш-память данных уровня Г.1 на 32 Кбайт с 8-канальной ассоциативностью 
для каждого ядра; 


е кеш-память уровня Г.2 на 8 Мбайт; 

» кеш-память уровня Г.3 на 64 Мбайт; 

е 20 линий РСЁе 4.0; 

» общая рассеиваемая мощность 105 Вт. 


На момент выпуска процессор Ву7еп 9 5950Х, возможно, был самым производи- 
тельным процессором семейства х86, доступным на рынке игр и фанатов произво- 
дительности. 


Прогнозирование ветвления в Вухеп 9 5950Х 


Архитектура Хеп 3 включает в себя сложный блок прогнозирования ветвления, ко- 
торый кеширует информацию, описывающую выбранные ветви, и использует эти 
данные для повышения точности будущих прогнозов. Этот анализ не только охва- 
тывает отдельные ветви, но и оценивает корреляцию с недавними ветвями в сосед- 
нем коде для дальнейшего повышения точности прогнозирования. Повышенная 
точность прогнозирования помогает исключить снижение производительности 
из-за конвейерных пузырей и сводит к минимуму ненужную работу, связанную с 
упреждающим выполнением ветвей, которые в конечном счете не выбираются. 


Блок прогнозирования ветвления использует форму машинного обучения, назы- 
ваемую персептроном. Персептроны — это упрощенные модели биологических 
нейронов, которые формируют основу для многих вариантов применения искусст- 
венных нейронных сетей. Краткое введение в искусственные нейронные сети было 
представлено в разд. "Глубокое обучение" главы 6. 
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В процессоре 5950Х персептроны учатся предсказывать поведение ветвления от- 
дельных инструкций на основе их недавнего поведения, а также поведения ветвле- 
ния других инструкций. Таким образом, отслеживая характер недавних случаев 
ветвления (с точки зрения выбранных и невыбранных ветвей), можно разработать 
корреляции для рассматриваемой инструкции ветвления, которые помогают повы- 
сить точность прогнозирования. 


Графический процессор Му4!а СеГогсе ВТХ 3090 


Для процессора Азгога Кутеп ЕФНоп К10 предлагается опция в виде графического 
процессора Му1Ч1а СеЕогсе КТХ 3090. В дополнение к общему высокому уровню 
графической производительности, которой можно ожидать от топового игрового 
графического процессора, это устройство обеспечивает мощную аппаратную под- 
держку трассировки лучей и содержит выделенные ядра для ускорения работы 
приложений машинного обучения. 


В традиционных графических процессорах визуальные объекты описываются в ви- 
де наборов многоугольников. Для визуализации сцены сначала необходимо опре- 
делить местоположение и пространственную ориентацию каждого многоугольника, 
после чего выполняется отрисовка видимых в сцене многоугольников в соответст- 
вующем месте изображения. 


Трассировка лучей использует альтернативный, более сложный подход. Изобра- 
жение с трассировкой лучей рисуется путем отслеживания пути света, излучаемого 
одним или несколькими источниками освещения в виртуальном мире. Когда лучи 
света встречаются с объектами, возникают такие эффекты, как отражение, прелом- 
ление, рассеяние и образование теней. 


Изображения с трассировкой лучей обычно выглядят гораздо более реалистичны- 
ми, чем сцены с визуализацией на основе многоугольников, однако для трассиров- 
ки лучей требуются гораздо большие вычислительные ресурсы. 


Сегодня большинство популярных, визуально насыщенных, высокодинамичных 
игр хотя бы в малой степени используют трассировку лучей. Для разработчиков 
игр ее использование не является бескомпромиссным решением. Части сцен можно 
отрисовывать в традиционном режиме на основе многоугольников, а трассировку 
лучей использовать для визуализации объектов и поверхностей, когда преимущест- 
ва этого метода позволяют извлечь наибольшую выгоду для отображаемой сцены. 
Например, сцена может содержать фоновые изображения, отображаемые в виде 
многоугольников, в то время как в расположенном рядом стеклянном окне с помо- 
щью метода трассировки лучей отображаются отражения объектов от поверхности 
стекла вместе с видом за стеклом. 


На момент своего выпуска КТХ 3090 был самым производительным графическим 
процессором, способным запускать модели глубокого обучения с помощью 
ТепзогЕ!ю\у — популярной программной платформы с открытым исходным кодом 
для приложений машинного обучения, разработанной исследовательской организа- 
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цией Соо2е по машинному интеллекту. ТепзогЕ]о\ широко применяется в иссле- 
дованиях с использованием глубоких нейронных сетей. 


ВТХ 3090 задействует свои возможности машинного обучения для увеличения ви- 
димого разрешения создаваемых изображений без вычислительных затрат на ви- 
зуализацию объектов с повышенным разрешением. Это осуществляется путем ин- 
теллектуального применения к изображению эффектов сглаживания и повышения 
резкости. Эта технология изучает характеристики десятков тысяч изображений во 
время их визуализации и использует эту информацию для улучшения качества 
сцен, создаваемых впоследствии. Например, с помощью данной технологии сцена, 
отрисованная с разрешением 1080р (1920 х 1080 пикселов), может выглядеть так, 
как если бы она имела разрешение 1440р (1920 х 1440 пикселов). 


Помимо поддержки технологий трассировки лучей и машинного обучения 
ВТХ 3090 обладает следующими особенностями. 


» Ядра 10496 МУШТА СОРА® составляют платформу параллельных вычисле- 
ний, подходящую для решения общих вычислительных задач, таких как ли- 
нейная алгебра. 


» 328 тензорных ядер выполняют тензорные и матричные операции в алго- 
ритмах глубокого обучения. 


е Интерфейс РС! 4.0 х16 обеспечивает взаимодействие с центральным про- 
цессором. 


» 24 Гбайт памяти СООЕБХ, которая является усовершенствованием преды- 
дущего поколения технологии СООКб, обеспечивая повышенную скорость 
передачи данных (до 21 Гбит/с на контакт по сравнению с максимумом 
16 Гбит/с на контакт в СООК6). 


» Масштабируемый интерфейс обмена данными Му а ЗсайаШе ГлаК 
Пиег асе (ЭГ.Г) связывает от двух до четырех идентичных графических про- 
цессоров в системе для распределения рабочей нагрузки по обработке. Для 
соединения взаимодействующих графических процессоров необходимо ис- 
пользовать специальный мостовой разъем. 


» Три видеовыхода О15р!ауРоге 1.4а. Интерфейсы ПО15р]ауРой поддерживают 
разрешение 8К (7680 х 4320 пикселов) при частоте 60 Гц. 


е Порт НОМГ 2.1. Выход НОМГ поддерживает разрешение 4К (3840 х 2160 
пикселов) при частоте 60 Гц. 


В следующем разделе кратко описываются подсистемы ПК АПепугаге Алгога Кутеп 
Едюп В10. 
Подсистемы ПК Аишгога 


В табл. 13.2 приведен краткий обзор основных подсистем ПК АПепууаге Амгога 
Ву7еп ЕЧоп В10. 
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Подсистема Описание 


Материнская плата |Материнская плата поддерживает интерфейс РСЁГе 4.0, удваиваю- 
щий пропускную способность для обмена данными между процес- 
сором и видеокартой относительно Ре 3.0. Имеется четыре гнезда 
для модулей памяти ООК4. Предусмотрены четыре гнезда РСТе, 
однако два из них занимает плата графического процессора М№у1Ч1а 
двойной ширины 


Чипсет Чипсет АМО В550А поддерживает разгон процессора и памяти, 
а также интерфейс Ре 4.0 

Охлаждение Для охлаждения процессора используется система жидкостного 
охлаждения АПепу’аге, которая критически необходима при разгоне 

Память Система включает в себя до 32 Гбайт двухканальной памяти ООК4 
ХМР, работающей на частоте 3200 МГц. Средства настройки кон- 
фигурации Ехгете Метогу РгоШе$ (ХМР) позволяют одновре- 
менно изменять несколько параметров, определяющих рабочие 
характеристики памяти, простым выбором среди различных профи- 
лей. Эта возможность обычно используется для выбора между стан- 


дартной конфигурацией синхронизации памяти и конфигурацией 
для разгона 


Хранение данных ПК Аугога Кугеп Е4оп К/10 оснащен твердотельным накопителем 
МУМе М.2 емкостью 1 Тбайт. Стандартным интерфейсом для под- 
соединения твердотельных накопителей к РСе 4.0 является М№оп- 
УоаШе Метогу ехргез$ (МУМе). Стандарт М.2 определяет малый 
типоразмер для карт расширения, таких как твердотельные накопи- 
тели 


Передняя панель Три порта ОЗВ 3.2 поколения | типа А, порт ОВ 3.2 поколения 1 
типа С, а также разъемы аудиовхода и аудиовыхода 


Задняя панель Система включает в себя шесть портов ОЗВ 2.0, четыре порта 
ЗВ 3.2 поколения 1 типа А, порт ОЗВ 3.2 поколения | типа С, порт 
Ефегпеь а также разъемы цифровых и аналоговых аудиовходов и 
аудиовыходов 


Игровой настольный ПК АПепуаге Апгога Кугеп Едоп В 10 объединяет в себе са- 
мые передовые технологии, доступные на момент его появления, по чистой скоро- 
сти процессора, памяти, графического процессора и хранилища, а также техноло- 
гию машинного обучения для ускорения выполнения команд. 


В следующем разделе мы перейдем от уровня персонального компьютера, рассмот- 
ренного в этом разделе, к проблемам внедрения и проектным решениям, характер- 
ным для крупномасштабных вычислительных сред, состоящих из тысяч интегриро- 
ванных и взаимодействующих друг с другом компьютерных систем. 
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Вычислительная архитектура масштаба 
центра обработки данных 


Поставщики услуг доступа к крупномасштабным вычислительным и сетевым ре- 
сурсам для населения и разветвленных организаций, таких как правительственные 
учреждения, исследовательские университеты и крупные корпорации, часто объе- 
диняют вычислительные ресурсы в больших зданиях, каждое из которых может 
содержать тысячи компьютеров. 


Для того чтобы наиболее эффективно использовать эти ресурсы, недостаточно рас- 
сматривать такую совокупность компьютеров в вычислительном комплексе 
масштаба центра обработки данных (\’агебоизе-5са!е сотрщег, \!$С), как просто 
большое количество отдельных компьютеров. Вместо этого, принимая во внимание 
огромный объем вычислительных и сетевых ресурсов, а также ресурсов для хране- 
ния данных, предоставляемых \/5С, более уместно рассматривать весь центр обра- 
ботки данных (ЦОД) как единую вычислительную систему с массовым паралле- 
лизмом. 


Ранние электронные вычислительные машины представляли собой огромные сис- 
темы, занимавшие большие помещения. С тех пор компьютерные архитектуры эво- 
люционировали до современных процессорных чипов размером с ноготь, обла- 
дающих значительно большей вычислительной мощностью, чем те ранние 
системы. Можно представить, что сегодняшние \/$С — это прелюдия к компью- 
терным системам, которые через несколько десятилетий будут иметь размер с ко- 
робку из-под пиццы или смартфон, или даже ноготь, и обладать такой же вычисли- 
тельной мощностью, как современные У/5С, если не намного большей. 


Со времени взлета Интернета в середине 1990-х годов происходит переход от про- 
грамм, установленных на персональных компьютерах, к централизованным сервер- 
ным системам, которые выполняют алгоритмические вычисления, сохраняют и из- 
влекают огромные объемы данных и обеспечивают прямую связь между 
пользователями Интернета. 


Эти серверные приложения используют тонкий уровень приложений на стороне 
клиента, часто предоставляемый веб-браузером. Все операции по поиску данных, 
вычислительной обработке и подготовке информации к отображению выполняются 
на сервере. Клиентское приложение просто получает инструкции и данные, касаю- 
щиеся текста, графики и элементов управления пользовательским интерфейсом, 
для представления пользователю. Затем браузерное приложение ожидает ввода 
данных пользователем и отправляет запросы на действия обратно на сервер. 


Онлайн-сервисы, предоставляемые такими интернет-компаниями, как @Соове, 
Ата2оп и Мтсгозой, полагаются на мощь и универсальность вычислительных архи- 
тектур очень крупных центров обработки данных для предоставления услуг мил- 
лионам пользователей. В одном из таких \$С можно запустить небольшое количе- 
ство весьма крупных приложений, одновременно предоставляющих услуги 
тысячам пользователей. 
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Ноставщики услуг стремятся обеспечить исключительную надежность, часто обе- 
щая время безотказной работы на уровне 99,99%, что соответствует примерно од- 
ному часу простоя в год. 


В следующих подразделах представлены аппаратные и программные компоненты 
типичного У\/5С и обсуждается, как эти компоненты работают вместе, чтобы пре- 
доставлять быстрые, эффективные и высоконадежные интернет-сервисы большому 
количеству пользователей. Данный раздел завершается пошаговым описанием дей- 
ствий по созданию и развертыванию простого веб-приложения в коммерческой об- 
лачной среде. 


Аппаратные средства \/$С 


Создание, эксплуатация и техническое обслуживание \$5С — дорогостоящие ме- 
роприятия. Обеспечивая необходимое качество обслуживания (отражаемое такими 
показателями, как скорость отклика, пропускная способность по передаче данных и 
надежность), операторы \/ЗС стремятся свести к минимуму общую стоимость вла- 
дения и эксплуатации этих систем. 


Для достижения максимально высокой надежности разработчики \/ЗС могут ис- 
пользовать один из двух следующих подходов при выборе базовых аппаратных 
средств. 


е Вложение средств в оборудование, обладающее исключительной надеж- 
ностью. Этот подход основан на использовании дорогостоящих компонентов 
с низкой частотой отказов. Однако, даже если каждая отдельная компьютер- 
ная система обладает превосходной надежностью, со временем, когда не- 
сколько тысяч копий системы будут работать одновременно, случайные сбои 
будут происходить со статистически предсказуемой частотой. Этот очень до- 
рогой подход, который в конечном счете не решает проблему, потому что 
сбои продолжают возникать. 


» Использование недорогого оборудования со средней надежностью и про- 
ектирование системы таким образом, чтобы она допускала отказы от- 
дельных компонентов с максимально высокой ожидаемой частотой. Та- 
кой подход позволяет значительно снизить затраты на оборудование по 
сравнению с высоконадежными компонентами, хотя для него требуется 
сложная программная инфраструктура, способная обнаруживать аппаратные 
сбои и быстро компенсировать их с помощью резервных систем таким обра- 
зом, чтобы поддерживать заявленное качество обслуживания. 


Большинство поставщиков стандартных интернет-услуг, таких как поисковые сис- 
темы и службы электронной почты, используют недорогое универсальное вычис- 
лительное оборудование и при возникновении сбоев выполняют переключение на 
резерв путем перевода рабочих нагрузок на включенные резервные системы. 


Для того чтобы конкретизировать это обсуждение, мы рассмотрим рабочие нагруз- 
ки, которые \/5С должен поддерживать для функционирования в качестве поиско- 
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вой системы в Интернете. Рабочие нагрузки \/$С, поддерживающие поиск в Ин- 
тернете, должны обладать перечисленными ниже атрибутами. 


»е Быстрое реагирование на поисковые запросы. Обработка запроса на поиск 
в Интернете на стороне сервера должна занимать лишь малую долю секунды. 
Если пользователи будут регулярно сталкиваться с ощутимой задержкой, 
свои будущие запросы они, скорее всего, доверят конкурирующей поисковой 
системе. 


е Информацию о состоянии, относящуюся к каждому поисковому запросу, 
не требуется сохранять на сервере, даже при последовательных случаях 
взаимодействия с одним и тем же пользователем. Другими словами, обра- 
ботка каждого поискового запроса представляет собой завершенное взаимо- 
действие. По завершении поиска сервер полностью забывает о нем. При сле- 
дующем поисковом запросе в тот же сервис от того же пользователя никакая 
сохраненная информация из предыдущего запроса не используется. 


Учитывая эти атрибуты, каждый запрос на обслуживание можно рассматривать как 
изолированное событие, не зависящее от всех других запросов, прошлых, настоя- 
щих и будущих. Независимость каждого запроса означает, что он может обрабаты- 
ваться как поток выполнения параллельно с другими поисковыми запросами, по- 
ступающими от других пользователей или даже от того же самого пользователя. 
Эта модель рабочей нагрузки является идеальным кандидатом для ускорения за 
счет аппаратного параллелизма. 


Обработка поисковых запросов в Интернете — это задача, которая требует не ин- 
тенсивных вычислений, а интенсивной работы с данными. Простой пример: при 
выполнении поиска по запросу, состоящему из одного слова, веб-сервис получает 
запрос от пользователя, затем извлекает искомый термин и сверяется со своим ин- 
дексом, чтобы определить наиболее подходящие для данного термина страницы. 


Интернет содержит как минимум сотни миллиардов страниц, и пользователи ожи- 
дают, что смогут найти большинство из них с помощью поиска. Однако это чрез- 
мерное упрощение, поскольку значительная доля страниц, доступных через Интер- 
нет, не индексируется поисковыми системами. Но даже если ограничить поиск 
доступными страницами, один сервер, пусть и с большим количеством процессор- 
ных ядер и максимальным установленным объемом оперативной и дисковой памя- 
ти, просто не сможет в разумные сроки справиться с ответами на запросы в Интер- 
нете для большой базы пользователей. Слишком много данных и слишком много 
пользовательских запросов. Вместо этого функцию поиска следует разделить меж- 
ду многими (сотнями, возможно, тысячами) отдельными серверами, каждый из ко- 
торых содержит подмножество всего индекса веб-страниц, известных поисковой 
системе. 


Каждый сервер индексирования получает поток запросов на поиск, которые про- 
шли фильтрацию и относятся к той части индекса, которой он управляет. Сервер 
индексирования генерирует набор результатов на основе совпадений с искомым 
термином и возвращает этот набор для обработки на более высоком уровне. При 
более сложных поисковых запросах разные серверы индексирования могут выпол- 
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нять отдельные запросы по нескольким искомым терминам. Результаты этих поис- 
ков затем нужно отфильтровать и объединить во время обработки на более высо- 
ком уровне. 


По мере того как серверы индексирования генерируют результаты на основе поис- 
ковых запросов, полученные подмножества передаются в систему, которая перера- 
батывает информацию в форму, подходящую для передачи пользователю. При 
стандартном поиске пользователи ожидают получить список страниц, ранжирован- 
ных по степени их соответствия запросу. Для каждой возвращаемой страницы по- 
исковая система обычно предоставляет ОВГ-адрес целевой страницы вместе с 
фрагментом текста, содержащим искомый термин, чтобы предоставить пользовате- 
лю некоторый контекст. 


Время, необходимое для формирования этих результатов, в значительной степени 
зависит от скорости поиска в базе данных, связанной с индексом страницы, и из- 
влечения содержимого страницы из хранилища, чем от вычислительной мощности 
серверов, участвующих в выполнении этой задачи. По этой причине многие \У$С, 
предоставляющие сервисы веб-поиска и аналогичные услуги, используют серверы, 
содержащие недорогие материнские платы, процессоры, компоненты памяти и на- 
копители. 


Стоечные серверы 


Серверы \!$С обычно собираются в стойках, причем каждый сервер использует 
один отсек типоразмера 10. Серверный отсек типоразмера 10 имеет отверстие 
на передней панели стойки шириной 433 мм (19 дюймов) и высотой 44,5 мм 
(1,75 дюйма). Одна стойка может содержать до 40 серверов, занимающих 178 см 
(70 дюймов) пространства по вертикали. 


Каждый сервер представляет собой полнофункциональную компьютерную систе- 
му, содержащую процессор средней мощности, оперативную память, локальный 
накопитель и интерфейс Е®егтей со скоростью от 1 Гбит/с. Поскольку возможности 
и пропускная способность процессоров потребительского класса, динамической 
памяти и накопителей продолжают расти, мы не будем пытаться определить пара- 
метры производительности конкретной конфигурации системы. 


Несмотря на то что каждый сервер содержит процессор со встроенной графической 
подсистемой и несколько ОЗВ-портов, большинство серверов не имеют дисплея, 
клавиатуры или мыши, подключенных напрямую, за исключением, разве что, пе- 
риода их первоначальной настройки. Серверы, устанавливаемые в стойку, обычно 
работают в режиме удаленного управления, в котором все взаимодействие с сис- 
темой осуществляется через ее сетевое подключение. 


На рис. 13.2 показана стойка, содержащая 16 серверов. 


Каждый сервер подключается к гигабитному порту сетевого коммутатора стойки с 
помощью кабеля Еее. Стойка в этом примере подключается к сетевой среде 
\!$С более высокого уровня с помощью четырех кабелей ЕФегпе! со скоростью 
1 Гбит/с. Серверы в стойке обмениваются данными друг с другом через коммута- 
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тор стойки на полной скорости передачи данных Еее 1 Гбит/с. Поскольку стой- 
ка имеет только четыре восходящих соединения со скоростью 1 Гбит/с, все 16 сер- 
веров, очевидно, не могут взаимодействовать на полной скорости с внешними по 
отношению к стойке системами. В этом примере подключение стойки является пе- 
регруженным с коэффициентом 4. Это означает, что пропускная способность 
внешней сети составляет одну четверть от пиковой скорости обмена данными для 
серверов в стойке. 


Сетевой коммутатор 


Распределен ие электропитания 


Рис. 13.2. Стойка с 16 серверами 


4х1 Гбит/с 


Восходящие сетевые 
соединения 


Стойки организованы в кластеры, которые совместно используют кластерный ком- 
мутатор второго уровня. На рис. 13.3 показана конфигурация, в которой четыре 
стойки подключены к каждому коммутатору кластерного уровня, который, в свою 
очередь, подключен к сети уровня \/5С. 


В конфигурации УС, показанной на рис. 13.3, запрос пользователя поступает че- 
рез Интернет и первоначально обрабатывается маршрутизатором, который направ- 
ляет запрос на доступный веб-сервер. Сервер, получающий запрос, отвечает за кон- 
троль процесса поиска и отправку ответа обратно пользователю. 


Несколько веб-серверов постоянно подключены к сети, чтобы обеспечить распре- 
деление нагрузки и резервирование в случае сбоя. На рис. 13.3 показаны три веб- 
сервера, но в загруженном \/$С могут одновременно работать гораздо больше сер- 
веров. Веб-сервер анализирует поисковый запрос и перенаправляет его на соответ- 
ствующие серверы индексирования в кластерах стоек \$С. На основе искомых 
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терминов веб-сервер направляет запросы на поиск по индексу одному или несколь- 
ким серверам индексирования для обработки. 


4 4 


4 4 
Стойка || Стойка || Стойка || Стойка 


Рис. 13.3. Внутренняя сеть И/5С 


Для эффективной и надежной работы \/ЗС должен поддерживать несколько копий 
каждого подмножества базы данных индексирования, распределенных между не- 
сколькими кластерами, чтобы обеспечить распределение нагрузки и резервирова- 
ние в случае сбоев на уровне сервера, стойки или кластера. 


Запросы на поиск по индексу обрабатываются серверами индексирования, а соот- 
ветствующий текст целевой страницы собирается с серверов документов. Полный 
набор результатов поиска собирается и передается обратно на соответствующий 
веб-сервер. Затем веб-сервер подготавливает полный ответ и передает его пользо- 
вателю. 


Конфигурация реального \/$С будет сложнее тех схем, что показаны на рис. 13.2 и 
13.3. Тем не менее эти упрощенные представления помогают нам оценить некото- 
рые из важных возможностей \/ЗС, поддерживающих рабочую нагрузку поисковой 
системы в Интернете. 


Помимо реагирования на поисковые запросы пользователей поисковая система 
должна регулярно обновлять свою базу данных, чтобы сохранить актуальность от- 
носительно текущего состояния веб-страниц в Интернете. Поисковые системы об- 
новляют свои знания о веб-страницах с помощью приложений, называемых поис- 
ковыми роботами. В качестве отправной точки поисковый робот выбирает адрес 
веб-страницы, затем считывает целевую страницу и анализирует ее содержимое. 
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Далее он сохраняет текст страницы в базе данных документов поисковой системы и 
извлекает все содержащиеся в ней ссылки. Для каждой найденной ссылки поиско- 
вый робот повторяет процесс чтения страницы, синтаксического анализа и перехо- 
да по ссылке. Таким образом, поисковая система создает и обновляет свою индек- 
сированную базу данных интернет-контента. 


В этом подразделе была кратко описана концепция конфигурации вычислительного 
комплекса уровня ЦОД (\/5С), который основан на стойках, заполненных стан- 
дартными вычислительными компонентами. В следующем разделе рассматривают- 
ся меры, которые \$С должен предпринять для обнаружения отказов компонентов 
и компенсации этих отказов без ущерба для общего качества обслуживания. 


Управление отказами аппаратных средств 


Как было показано выше, \!$С содержат тысячи компьютерных систем. Мы впол- 
не можем ожидать, что аппаратные сбои будут происходить регулярно, даже если 
для системы были выбраны наиболее дорогостоящие компоненты, обеспечиваю- 
щие высокий, но не идеальный уровень надежности. 


На схеме, показанной на рис. 13.3, подразумевается, что каждый сервер, отправ- 
ляющий запрос в систему на более низком уровне, должен отслеживать скорость 
реагирования и корректность откликов системы, назначенной для обработки запро- 
са. Этот процесс является неотъемлемой частью многоуровневых операций отправ- 
ки, обработки и возврата результатов. Если ответ недопустимо задерживается или 
не проходит проверку на достоверность, система нижнего уровня должна быть за- 
регистрирована как не реагирующая на запросы или неправильно работающая. 


При обнаружении такой ошибки запрашивающая система сразу же пересылает за- 
прос на резервный сервер для обработки. В некоторых случаях задержки откликов 
могут быть вызваны временными событиями, такими как кратковременная пере- 
грузка ресурсов обработки. Если сервер нижнего уровня восстанавливается и про- 
должает работать должным образом, никакие ответные действия не требуются. 


Если же сервер постоянно не отвечает на запросы или выдает ошибки, необходимо 
отправить запрос на техническое обслуживание для устранения неполадок и ре- 
монта неисправной системы. При выявлении недоступной системы руководство 
\/$С (будь то человек или автоматическая система) может отдать команду на вы- 
бор другой системы из пула резервных систем для репликации отказавшего сервера 
и дать указание сменной системе начать обслуживание запросов от пользователей. 


Потребление электроэнергии 


Одним из основных факторов, определяющих стоимость \/5С, является потребле- 
ние электроэнергии. Основными потребителями электроэнергии в \/5С являются 
серверы и сетевые устройства, которые выполняют обработку данных для конеч- 
ных пользователей, а также система кондиционирования воздуха, обеспечивающая 
охлаждение этих систем. 
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Для того чтобы свести счета за электроэнергию \/$С к минимуму, крайне важно 
включать компьютеры и другие потребляющие много энергии устройства только 
тогда, когда они могут сделать что-то полезное. Нагрузка на поисковую систему с 
течением времени сильно меняется и может резко увеличиваться в ответ на собы- 
тия в новостях и социальных сетях. \/5С должен поддерживать достаточное коли- 
чество рабочих серверов, чтобы обеспечить максимальный уровень трафика, на ко- 
торый он рассчитан. Когда общая рабочая нагрузка ниже максимальной, все 
серверы, для которых нет работы, должны быть выключены. 


Даже слегка загруженный сервер потребляет значительное количество электро- 
энергии. Для достижения наилучшей эффективности система управления \/5С 
должна полностью отключать серверы и другие устройства, когда они не нужны. 
При увеличении трафика серверы и связанные с ними сетевые устройства могут 
быть быстро включены и подсоединены к сети для поддержания требуемого каче- 
ства обслуживания. 


\!$С как многоуровневый информационный кеш 


Мы рассмотрели многоуровневую архитектуру кеша, используемую в современных 
процессорах, в главе 8. Для достижения оптимальных рабочих характеристик веб- 
сервис, такой как поисковая система, должен использовать стратегию кеширова- 
ния, которая, по сути, добавляет дополнительные уровни к тем, что уже существу- 
ют в процессоре. 


Для того чтобы свести время отклика к минимуму, сервер индексирования должен 
хранить значительное подмножество своих индексных данных в базе данных, на- 
ходящейся в памяти. Выбирая контент для хранения в памяти на основе историче- 
ских моделей использования, а также последних тенденций поиска, можно добить- 
ся удовлетворения значительной доли входящих запросов без доступа к дисковому 
хранилищу. 


Для того чтобы наилучшим образом использовать базу данных в памяти, явно вы- 
годно иметь большой объем ОКАМ на каждом сервере. Выбор оптимального объе- 
ма ОКАМ для установки на каждый сервер индексирования зависит от таких пара- 
метров, как относительная стоимость дополнительной ОКАМ на сервер по 
сравнению со стоимостью дополнительных серверов, содержащих меньше памяти, 
а также от сравнения производительности большего количества серверов с мень- 
шим объемом памяти и меньшего количества серверов с большим объемом памяти. 


Мы не будем здесь углубляться в этот анализ, однако следует отметить, что такие 
оценки являются ключевым элементом оптимизации архитектуры \/ЗС. 


Если мы рассматриваем ОКАМ как первый уровень кеширования на уровне У\/5С, 
то следующий уровень — это локальный накопитель на каждом сервере. В случае 
отсутствия нужной информации в базе данных в памяти следующим местом для 
поиска является накопитель сервера. Если результат не найден на локальном нако- 
пителе, то следующий уровень поиска — это другие серверы, расположенные в той 
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же стойке. Обмен данными между серверами в одной стойке может осуществляться 
на полной скорости сети (1 Гбит/с в нашем примере конфигурации). 


Следующий уровень поиска охватывает стойки в пределах одного кластера. Пропу- 
скная способность передачи данных между стойками определяется связывающими 
их линиями и характеристиками кластерного коммутатора, которые ограничивают 
скорость обмена данными по этим соединениям. Конечный уровень поиска в \5С 
охватывает кластеры, что, вероятно, накладывает дополнительные ограничения на 
пропускную способность. 


Значительная часть задач по созданию эффективной инфраструктуры поисковой 
системы заключается в разработке высокопроизводительной архитектуры про- 
граммного обеспечения. Эта архитектура должна удовлетворять высокую долю по- 
исковых запросов с помощью самых быстрых и локализованных поисковых запро- 
сов, доступных серверам индексирования и серверам документов поисковой 
системы. Это означает, что основная доля поисковых запросов должна выполняться 
с помощью поиска в памяти на серверах индексирования. 


Развертывание облачного приложения 


В этом разделе мы рассмотрим необходимые действия по разработке и развертыва- 
нию простого веб-приложения на облачной платформе М!сгозой Аллге. Этот при- 
мер показывает, как разработчики могут в полной мере использовать преимущества 
операторов крупных и сложных \5$С, применяя легкодоступные инструменты раз- 
работки. В этом примере используются бесплатные программные средства и об- 
лачный сервис. 


1. Перейдите по адресу № рз$://атиге.писгозоЙ.сот/еп-из/Лгее/ и создайте бес- 
платную учетную запись Атиге. Атиге — это сервис облачных вычислений, 
предоставляемый корпорацией М!сгозоВ. 


2. Перейдите по адресу №Ирз://поде]5.ог2/еп/ и установите Моде.]$ — среду вы- 
полнения для веб-серверных приложений, написанных на языке Лауа5 сир. 


3. Перейдите по адресу И@рз://соде.у1зиа] $1 1о.сот/ и установите У15иа| 5910 
Соде (сокращенно У$ Со4е) — многоязычный редактор исходного кода. 


4. Перейдите по адресу И@рз://тагКер!асе.у15 ца 5 и о.сот/иет$?ИетМате= 
п15$-а71ге00[5.у5соде-а7игеаррзегуге и установите Атоге Арр Зегусе для УЗ Соде. 
А7иге Арр Зегулсе — это расширение для У$ Соде, которое помогает создавать 
и развертывать веб-приложения в А7иге. 


Приведенные ниже инструкции предназначены для демонстрации в операционной 
системе У\/ш4о\$, но аналогичные (или идентичные во многих случаях) команды 
будут работать и на хостах с ОС Т.,пих. 


После установки этих программ откройте окно командной строки \/тдо\$ и вве- 
дите следующие команды, чтобы создать простое веб-приложение и запустить его 
на своем компьютере: 
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С:\РгодесЕ$>прх ехргез5-вепегафог меБарр --у1ем рив 


5>сЧ мебарр 
ебарр>прм 1п${а11 


/ебарр>прт $Таг\ 


Откройте веб-браузер и перейдите по адресу ВНр:/Лосао$(:3000. Вы увидите веб- 
страницу, которая выглядит так, как показано на рис. 13.4. 


Ехргез Хх + — О х 
<= -> С О 0 юсея3000 т &х » = 

Ехрге$$ 

\мекоте © Ехргез$ 


Рис. 13.4. Экран простого приложения М№ аеЕ.]5 


Это приложение не делает ничего объективно полезного, однако код, созданный на 
предыдущих этапах, составляет прочную основу для создания сложного, масшта- 
бируемого веб-приложения. 


На следующих этапах мы развернем это приложение в облачной среде Аше, ис- 
пользуя бесплатную учетную запись Атиге. 


1. Запустите редактор УЗ Соде в каталоге меварр: 


С: \Ргодес*$ \мебарр>соае 


Выберите логотип Адге, показанный в левом нижнем углу на рис. 13.5. 


Нажмите 511 ш © Ал7оге... (Вход в Ааге) и завершите процесс создания новой 
бесплатной учетной записи и входа в систему. 


4. Щелкните на значке облака справа от АРР ЗЕВУТСЕ, как показано на рис. 13.6. 
Если значок не виден, наведите курсор на эту область, и он появится. При появ- 
лении приглашения перейдите в папку меБарр. 


5. Щелкните + | Сгеме пеу У№еь Арр... | Адуапсед (+ | Создать новое веб- 
приложение... | Дополнительно). Появляется приглашение ввести уникальное 
имя для своего приложения. Например, имя мефарр уже используется, но 
уеБарр228 — еще нет. Выберите другое имя. 


6. Щелкните + | Сгеже а пе\ гезоигсе ргоир (+ | Создать группу ресурсов) и дай- 
те группе имя, например мефарр228-го. 
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10. 


Рис. 13.5. Добавление параметра приложения 


» ВЕЗОШВСЕ СВОУРУ 
> НЕШР АМО ЕЕЕБВАСК 
`“ АРР ЗЕВУКЕ 


Рис. 13.6. Развертывание в облаке 


Появляется приглашение выбрать стек времени выполнения. В этом случае вы- 
берите Моде 16 ГТ$. 


Выберите операционную систему У т9о\5. 
Выберите географическое местоположение для развертывания, например УУе$ 
0$ 2. 


Щелкните + | Сгеже пем Арр Зегусе р1ап (+ | Создать новый план служб при- 
ложений). Дайте плану имя, например меБарр228-р!ап. Выберите уровень цен 
Егее (Е1) (Бесплатно). 
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11. При появлении приглашения + Сгеже пеу АррНсабоп $285 (Создать 
Арр|сайоп 1151285) выберите $Юр ог по\ (Пока пропустить). 


12. В А7аге начинается подготовка приложений, которая займет некоторое время. 
При появлении приглашения А№уау$ дероу Ше ууогК5расе “уеБарр” ® “\е- 
Барр228”? (Всегда развертывать рабочее пространство \еБарр в \ефарр228?) 
выберите Уе$ (Да). 


13. В У$ Соде раскройте узел АРР ЗЕВУТСЕ, затем раскройте меЪарр228. Щелк- 
ните правой кнопкой мыши на команде АррИсабоп Зе тез (Настройки при- 
ложения). Выберите команду А9Я М№е\уу Зе тео... (Добавить новое значение...), 
как показано на рис. 13.7. 


АДА Чем зето.. 


Рис. 13.7. Добавление параметра приложения 


14. Введите $СМ_р0_ВиТ.О_БУВТА№б_ОЕРЕОУМЕМТ в качестве ключа параметра и {гие в каче- 
стве его значения. Этот шаг приведет к автоматическому созданию файла 
меб. соп+1в, который необходим для развертывания. 


15. Снова выберите значок облака рядом с АРР ЗЕВУ(СЕ и разверните приложение. 


16. После завершения развертывания щелкните на Вго\зе УУебзНе (Обзор веб- 
сайта), чтобы открыть веб-сайт в своем браузере. В этом примере веб-сайт име- 
ет ЧКГ-адрес в@р$://муеБарр228.а2игеме6 $ Кез.пей/. Это публичный веб-сайт, 
доступный любому пользователю Интернета. 


Описанные выше действия продемонстрировали процедуру создания и развертыва- 
ния простого веб-приложения в полнофункциональной облачной среде. Благодаря 
развертыванию в среде Алгиге наше приложение в полной мере использует возмож- 
ности облачной платформы Атлге, которые обеспечивают высокую производитель- 
ность, масштабируемость и безопасность. 
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В следующем разделе рассматриваются высокопроизводительные архитектуры, 
используемые в специализированных процессорах для нейронных сетей. 


Архитектура процессоров 
для нейронных сетей и машинного обучения 


С архитектурой нейронных сетей мы кратко ознакомились в главе 6. В этом разделе 
рассматривается внутреннее устройство высокопроизводительного специализиро- 
ванного процессора для нейронных сетей. 


Нейропроцессор п{е| Мегуапа 


В 2019 г. корпорация Ш! объявила о выпуске пары новых процессоров, один из 
которых был оптимизирован для задачи обучения сложных нейронных сетей, 
а другой — для использования обученных сетей с целью выполнения логического 
вывода — процесса получения выходных данных нейронной сети на основе задан- 
ного набора входных данных. 


Нейропроцессор для обучения (пеига| пебмогК ргосеззог юг Нашш?, ММР-Т) по 
сути представляет собой миниатюрный суперкомпьютер, адаптированный к вычис- 
лительным задачам, необходимым для процесса обучения нейронной сети. ММР-Т1000 
доступен в следующих двух конфигурациях. 


» ММР-Т1300 представляет собой карту с двумя гнездами РСШе, подходящую 
для установки в стандартный ПК. Карта связывается с хостом через интер- 
фейс РСРе 4.0 х16. Несколько карт ММР-Т1300, установленных в одной или в 
нескольких компьютерных системах, можно соединить друг с другом с по- 
мощью кабелей. 


» ММР-Т1400 — это мезонинная карта для использования в качестве модуля 
обработки в модуле-ускорителе Ореп Сотрше Ргодесй (ОСР) Ассёаегаюг 
Модше (ОАМ). Мезонинная карта — это печатная плата, которая вставля- 
ется в разъем на другой вставной печатной плате, например на плате РСТе. 
ОАМ — это спецификация проектирования аппаратных архитектур, реали- 
зующих системы искусственного интеллекта, которые требуют высокой про- 
пускной способности для обмена данными между модулями. Разработкой 
стандарта ОАМ руководили Еасебоок, Мисгозой и Вади. Путем объединения 
до 1024 модулей ММР-Т1000 можно создать крупную архитектуру нейросете- 
вой обработки с чрезвычайно высокоскоростными последовательными со- 
единениями между модулями. 


ММР-Т1300 можно установить в стандартный ПК для использования отдельным 
разработчиком. При этом конфигурация из нескольких процессоров ММР-Т1400 
быстро становится весьма дорогостоящей и начинает напоминать суперкомпьютер 
с точки зрения производительности. 
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Основные области применения для мощных архитектур ММР, таких как Мегуапа, — 
обработка информации на естественном языке (пафшга]| 1априаре ргосеззте, МЕР) 
и машинное зрение. Технология МГР решает такие задачи, как обработка последо- 
вательностей слов для извлечения заложенного в них смысла, а также составление 
сообщений на естественном языке для взаимодействия компьютера с людьми. Ко- 
гда вы звоните на линию поддержки клиентов компании и компьютер просит вас 
поговорить с ним, вы взаимодействуете с системой МЕР. 


Машинное зрение — это ключевая технология, позволяющая создавать автономные 
транспортные средства. Системы машинного зрения для автомобилей обрабатыва- 
ют потоки данных с видеокамер для обнаружения и классификации дорожных объ- 
ектов, дорожных знаков и препятствий, таких как транспортные средства и пеше- 
ходы. Для того чтобы быть полезной во время управления транспортным 
средством, эта обработка должна выдавать результаты в реальном времени. 


Построение нейронной сети для выполнения задач, которые обычно решает чело- 
век, таких как чтение текста и его интерпретация или вождение автомобиля в усло- 
виях интенсивного движения, требует обширного обучения. Обучение нейронной 
сети включает в себя последовательные этапы предоставления сети набора входных 
данных вместе с ответом, который должна выдать сеть при наличии таких входных 
данных. Эта информация, состоящая из пар наборов входных данных и наборов 
заведомо правильных выходных данных, называется обучающим набором. Каж- 
дый раз, когда сеть получает новый набор входных данных и выходные данные, 
которые должны быть получены на основе этих входных данных, она слегка кор- 
ректирует свои внутренние соединения и весовые коэффициенты, чтобы улучшить 
свою способность генерировать правильные выходные данные. Для сложных ней- 
ронных сетей, на которые нацелено решение Мегуапа ММР, обучающий набор мо- 
жет состоять из миллионов пар наборов входных и выходных данных. 


Обработка, требуемая алгоритмами обучения ММР, сводится в основном к матрич- 
ным и векторным манипуляциям. Умножение больших матриц является одной из 
наиболее распространенных и трудоемких задач при обучении нейронных сетей. 
Эти матрицы могут содержать сотни или даже тысячи строк и столбцов. Основной 
операцией при умножении матриц является умножение с накоплением (МАС), 
с которой мы ознакомились в главе 6. 


Сложные нейронные сети содержат огромное количество весовых параметров. Во 
время обучения процессор должен раз за разом обращаться к этим значениям, что- 
бы вычислять силу сигнала, связанную с каждым нейроном в модели, и вносить 
коррективы в веса при обучении. Для достижения максимальной производительно- 
сти при заданных объеме памяти и пропускной способности внутренней связи же- 
лательно использовать для хранения каждого числового значения наименьший 
применимый тип данных. В большинстве приложений обработки чисел 32-битный 
формат ГЕЕЕ с плавающей запятой и одинарной точностью представляет собой 
наименьший тип данных. Если возможно, лучше использовать еще меньший фор- 
мат с плавающей запятой. 
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В архитектуре процессора Мегуапа для хранения сигналов сети используется спе- 
циализированный формат с плавающей запятой. Этот формат, БЙоа{16, основан на 
32-битном формате ГЕЕЕ-754 с плавающей запятой и одинарной точностью за ис- 
ключением того, что мантисса усечена с 24 до 8 бит. 32-битный и 64-битный фор- 
маты [ЕЕЕ-754 с плавающей запятой были рассмотрены в разд. "Арифметика с 
плавающей запятой" главы 9. 


Причины использования для нейросетевой обработки формата БЯоа 6 вместо 16-бит- 
ного формата ГЕЕЕ-754 с плавающей запятой и половинной точностью заключают- 
ся в следующем. 


» 16-битный формат ТЕЕЕ-754 содержит знаковый бит, 5 бит порядка и 11 бит 
мантиссы, один из которых является подразумеваемым. По сравнению с 32-бит- 
ным форматом ТЕЕЕ-754 с плавающей запятой и одинарной точностью этот 
формат с половинной точностью теряет три бита порядка, уменьшая диапа- 
зон представляемых числовых значений до одной восьмой диапазона 32-бит- 
ного представления с плавающей запятой. 


» Формат БНоа 6 сохраняет все 8 бит порядка, принятые в формате одинарной 
точности ГЕЕЕ-754, что позволяет ему охватывать весь числовой диапазон 
32-битного формата ТЕЕЕ-754, хотя и со значительно сниженной точностью. 


Основываясь на результатах исследований и отзывах клиентов, ие! предполагает, 
что формат ЬЙоа{16 лучше всего подходит для приложений глубокого обучения, 
поскольку больший диапазон порядка важнее, чем более точная мантисса. В сущ- 
ности, {| предполагает, что эффект квантования, возникающий в результате 
уменьшения размера мантиссы, не оказывает существенного влияния на точность 
логического вывода в сетевых реализациях на основе формата 6Йоа{16 по сравне- 
нию с реализациями на основе ГЕЕЕ-754 с одинарной точностью. 


Основной тип данных, используемый при обработке данных в искусственных ней- 
ронных сетях, — это тензор, который представлен в виде многомерного массива. 
Вектор — это одномерный тензор, а матрица — двумерный тензор. Также могут 
быть определены тензоры более высокой размерности. В архитектуре процессора 
Мегуапа тензор представляет собой многомерный массив значений БЙоа{1 6. Тензор 
является основным типом данных архитектуры Мегуапа — ММР-Т работает с тензо- 
рами на уровне набора инструкций. 


Наиболее ресурсоемкой операцией, выполняемой алгоритмами глубокого обуче- 
ния, является умножение тензоров. Ускорение этих операций умножения — основ- 
ная цель специализированного оборудования для обработки данных искусственны- 
ми нейронными сетями, такого как архитектура Мегуапа. Ускорение операций с 
тензорами требует не только высокопроизводительной математической обработки; 
также важно эффективно передавать данные операндов в ядро для обработки и 
столь же эффективно перемещать выходные результаты по месту их назначения. 
Это требует тщательной балансировки возможностей по обработке чисел, скорости 
чтения/записи в память и скорости передачи данных. 


Обработка в архитектуре ММР-Т выполняется в кластерах тензорных процессо- 
ров ({епзог ргосеззог са$егз, ТРС), каждый из которых содержит два модуля вы- 
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полнения операций умножения с накоплением (тшШ@ру асситшае, МАС) и 
2,5 Мбайт высокоскоростной памяти. Высокоскоростная память (0121 Бапд\19 
тетогу, НВМ) отличается от РОК ЗОКАМ тем, что в ней несколько кристаллов 
ОКАМ собраны в пакет, благодаря чему обеспечивается гораздо более широкая 
полоса передачи данных (1024 бита по сравнению с 64 битами для РОК). Каждый 
модуль обработки МАС содержит массив 32х32 параллельно работающих 
МАС-процессоров. 


Процессор ММР-Т содержит до 24 параллельно работающих кластеров тензорных 
процессоров (ТРС) с высокоскоростными последовательными интерфейсами, со- 
единяющими их в конфигурацию типа "фабрика". Устройства Мегуапа обеспечива- 
ют высокоскоростные последовательные соединения между дополнительными пла- 
тами Мегуапа в одной и той же системе и с устройствами Мегуапа на других 
компьютерах. 


Один процессор ММР-Т может выполнять 119 триллионов операций (или тера- 
операций) в секунду (иИоп орегайоп$ рег 5есоп4, ТОР5). В табл. 13.3 сравнивают- 
ся параметры этих двух процессоров. 


Таблица 13.3. Особенности процессорных конфигураций ММР Т-1000 


Процессорные ядра 
(кластеры тензорных 
процессоров) 


Тактовая частота 1100 МГц 
процессора 


60 Мбайт ЗКАМ с ЕСС 
Высокоскоростная память | 32 Гбайт высокоскоростной памяти |32 Гбайт НВМ2 с ЕСС 
второго поколения (НВМ2) с ЕСС 
Пропускная способность |2,4 Гбит/с (300 Мбайт/с) 2,4 Гбит/с 
памяти (300 Мбайт/с) 


Последовательное меж- 16х 112 Гбит/с (448 Гбайт/с) 16х 112 Гбит/с 
чиповое соединение (1т- (448 Гбайт/с) 
{ег-сшр Ипк, 1СГ.) 


Нейропроцессор Мегуапа для логического вывода (пеига| пебмогк ргосеззог Юг 
шёегепсе, ММР-Г) выполняет фазу логического вывода в процессе обработки данных 
нейронной сети. Фаза логического вывода состоит из ввода входных данных в 
предварительно обученные нейронные сети, обработки этих входных данных и по- 
лучения выходных данных из сети. В зависимости от области применения процесс 
логического вывода может включать в себя повторяющиеся оценки одной очень 
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большой сети на основе меняющихся во времени входных данных или применение 
множества различных моделей нейронной сети к одному и тому же набору входных 
данных при каждом обновлении этих входных данных. 


Нейропроцессор ММР-[ доступен в двух следующих типоразмерах: 


» карта РЦЕ с двумя устройствами М№Р 1-1000, которая рассчитана на 170 тера- 
операций в секунду и рассеивает до 75 Вт; 


» карта М.2 с одним устройством ММР 1-1000, которая рассчитана на 50 тера- 
операций в секунду и рассеивает всего 12 Вт. 


Архитектура Мегуапа — это продвинутая среда обработки, подобная суперкомпью- 
теру и оптимизированная для обучения нейронных сетей и построения логических 
выводов на основе реальных данных с использованием предварительно обученных 
сетей. 


Резюме 


В этой главе представлено несколько архитектур компьютерных систем, адаптиро- 
ванных к особым потребностям пользователей, и определены некоторые ключевые 
особенности, связанные с каждой из них. Мы рассмотрели следующие категории 
применения: смартфоны, игровые персональные компьютеры, вычислительные 
комплексы уровня ЦОД и нейронные сети. Эти примеры обеспечили связь между 
теоретическими обсуждениями компьютерных и системных архитектур и компо- 
нентов, представленных в предыдущих главах, и реальными реализациями совре- 
менных высокопроизводительных вычислительных систем. 


Прочитав эту главу, вы должны понимать процессы принятия решений, используе- 
мых при определении компьютерных архитектур для поддержки конкретных по- 
требностей пользователей. Вы также получили представление о ключевых требова- 
ниях, определяющих архитектуру интеллектуальных мобильных устройств, 
высокопроизводительных персональных компьютеров, вычислительных комплек- 
сов уровня ЦОД и машинного обучения. 


В следующей главе представлены категории угроз кибербезопасности, с которыми 
сталкиваются современные компьютерные системы, и рассмотрены вычислитель- 
ные архитектуры, подходящие для приложений, требующих исключительных га- 
рантий безопасности, таких как системы национальной безопасности и обработка 
финансовых транзакций. 


Упражнения 


1. Нарисуйте блок-схему вычислительной архитектуры для системы круглосуточ- 
ных измерений и передачи данных о погоде с интервалом в 5 минут с помощью 
текстовых сообщений 5М$. Система работает от аккумулятора и использует 
солнечные батареи для подзарядки аккумулятора в светлое время суток. Пред- 
положим, что метеорологические приборы потребляют минимальную среднюю 
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мощность, требуя лишь кратковременного выхода на полную мощность в каж- 
дом цикле измерений. 


2. Для системы из упражнения 1 определите подходящий доступный на рынке 
процессор и укажите причины, по которым этот процессор является хорошим 
выбором для данного приложения. Факторы, которые следует учитывать, вклю- 
чают стоимость, скорость обработки, устойчивость к суровым условиям, энер- 
гопотребление и встроенные компоненты, такие как оперативная память и ин- 
терфейсы для обмена данными. 
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Архитектуры для обеспечения 
кибербезопасности 
и конфиденциальности вычислений 


В этой главе представлены вычислительные архитектуры, подходящие для решения 
задач, требующих исключительных гарантий безопасности. Такой высокий уровень 
защиты необходим в критически важных областях, включая системы национальной 
безопасности и обработку финансовых транзакций. Эти системы должны быть ус- 
тойчивы к широкому спектру угроз кибербезопасности, в том числе к проникнове- 
нию вредоносного кода, атакам через скрытые каналы и путем физического досту- 
па к аппаратным средствам компьютеров. Среди тем, рассматриваемых в этой 
главе, — угрозы кибербезопасности, шифрование, цифровые подписи и архитек- 
турные решения для защиты аппаратных средств и программного обеспечения. 


После прочтения этой главы вы будете способны определять категории угроз ки- 
бербезопасности, с которыми может столкнуться система, и разбираться в способах 
обеспечения безопасности современных компьютеров. Вы узнаете, как можно из- 
бежать брешей в безопасности системных архитектур и как защищенная компью- 
терная архитектура может помочь обеспечить безопасность в программных прило- 
жениях. 


В этой главе будут представлены следующие темы: 
» угрозы кибербезопасности; 
» особенности защищенного оборудования; 
е конфиденциальные вычисления; 
»е меры безопасности на уровне архитектуры; 


» обеспечение безопасности системного и прикладного ПО. 


408 Глава 14 


Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 
В@рз://2 тиБ.сот/Раск Ри $ тр/Модегп-Сотршег-АгсВКесшге-апд- 
Ограп17аНоп-Зесопд-ЕЗ оп. 


Угрозы кибербезопасности 


Первым шагом в обеспечении кибербезопасности компьютерной системы является 
понимание угроз, с которыми она может столкнуться и от которых должна быть 
защищена. Мы можем разделить эти угрозы на несколько широких категорий и 
определить ключевые особенности каждой из них. Используя эту информацию, мы 
можем спроектировать архитектуру компьютерной системы с атрибутами, которые 
обеспечат надлежащий уровень защиты от этих угроз. 


К сожалению, разработка полностью защищенной компьютерной системы — край- 
не непростой процесс. Это связано с тем, что в существующих операционных сис- 
темах, библиотеках программного обеспечения, пользовательских приложениях и 
веб-приложениях регулярно выявляются новые уязвимости. Нередко обнаружива- 
ются недостатки в широко используемых криптографических компонентах, таких 
как алгоритмы шифрования и протоколы аутентификации. По мере разработки но- 
вых программных продуктов в них часто возникают совершенно новые уязвимости, 
которые рано или поздно будут обнаружены. Самое главное, опыт показывает, что 
наиболее слабые места в системе безопасности, связанные с используемыми нами 
компьютерными системами, создаются людьми, которые ими управляют. 


Учитывая эти реалии, мы можем лишь стремиться снизить риск разрушительной 
кибератаки до достаточно низкого уровня, а не устранить его полностью. В процес- 
се защиты системы от атак мы должны удерживать стоимость защитных мер на 
приемлемом уровне, при этом система не должна быть слишком обременительной 
для пользователей в эксплуатации. Средства защиты также не должны приводить к 
снижению надежности системы с точки зрения выполнения ее предполагаемой 


функции. 


Категории угроз кибербезопасности 


В качестве первого шага к пониманию ситуации в области угроз кибербезопасности 
мы рассмотрим категории людей и организаций, которые планируют и осуществ- 
ляют кибератаки. На основании исторических моделей кибератак против отдель- 
ных лиц, государственных учреждений, предприятий и других групп были опреде- 
лены следующие основные категории угроз. 


е Национальные правительства. Было достоверно определено, что многие 
страны, в том числе те, которые можно рассматривать как "враждебные", 
а также те, которые принято считать "дружественными", проводили агрес- 
сивные кибератаки против других государств, коммерческих предприятий и 
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иных организаций в разных странах и даже против конкретных лиц. Военные 
киберподразделения планируют и осуществляют кибератаки против враж- 
дебных государств для достижения тактических и стратегических целей. 


» Террористы. Террористические организации выражали намерения провести 
потенциально разрушительные кибератаки против правительств и промыш- 
ленных систем с различными возможными последствиями — от широкомас- 
штабных отключений электроэнергии до разрушения крупномасштабных 
объектов инфраструктуры, таких как плотины, нефтеперерабатывающие за- 
воды и трубопроводы. Потенциал таких атак был продемонстрирован неод- 
нократно, однако реальные случаи разрушительных нападений до сих пор 
были редки. 


® Промышленные шпионы. Во многих отраслях, особенно связанных с высо- 
кими технологиями, секретная информация о программных компонентах и 
аппаратных средствах может стать главной мишенью для хакеров. Если зло- 
умышленники смогут получить доступ к компьютерной сети, где находится 
желаемая информация, они могут скопировать ее и использовать в собствен- 
ных целях или просто продать тому, кто предложит наиболее высокую цену. 


» Преступные группировки. Группы криминальных хакеров проводят атаки, 
такие как проникновение в компьютерные системы, содержащие личную ин- 
формацию, например данные кредитных карт, с целью ее продажи другим 
преступникам или непосредственного использования для совершения неза- 
конных покупок. Еще одна категория киберпреступлений — вымогательство 
с помощью вредоносных программ. При атаке с помощью программы- 
вымогателя хакеры загружают на компьютер жертвы программное обеспече- 
ние, которое шифрует файлы ценных данных. Злоумышленник требует от 
жертвы оплаты в обмен на предоставление ключа, который предположитель- 
но позволит расшифровать данные пользователя. На нижней ступени техно- 
логической лестницы продолжает процветать мошенничество с массовыми 
рассылками по электронной почте. Таким способом злоумышленники пыта- 
ются вовлечь получателей в разговор с преступниками, который может при- 
вести к дорогостоящему разочарованию для неосторожных. 


» Хакеры-активисты. Некоторые кибер-злоумышленники заявляют, что в 
своих атаках против предположительно аморальных врагов, таких как не- 
угодные корпорации или правительства, руководствуются справедливыми 
мотивами. Таких людей называют хактивистами, комбинируя слова "хакер" 
и "активист". Хактивисты предпринимают такие действия, как массовая 
бомбардировка целевого веб-сайта огромным количеством запросов, в ре- 
зультате чего сайт становится недоступным для обычных пользователей. 
Хактивисты также могут попытаться украсть принадлежащие цели конфи- 
денциальные данные, а затем опубликовать их, чтобы поставить в неловкое 
положение или скомпрометировать организацию, которая является источни- 
ком этой информации. 
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» Белые хакеры. Следуя определенной традиции, хакеры могут исследовать 


цель, а затем спланировать и осуществить против нее кибератаку ради чисто- 
го интеллектуального удовольствия. В других случаях исследователи кибер- 
безопасности могут изучать цель, возможно, веб-сайт или цифровое устрой- 
ство, такое как смартфон, для выявления одной или нескольких уязвимостей. 
Затем исследователь делится информацией с владельцем сайта или изготови- 
телем устройства, чтобы поспособствовать повышению безопасности. По 
прошествии достаточного для устранения уязвимостей времени исследова- 
тель публикует информацию о ней. Этот процесс называется белым хакер- 
ством с отсылкой к ранним американским вестернам, в которых главные ге- 
рои носили белые шляпы, а злодеи — черные. 


Инсайдеры (сознательные и невольные). Наиболее распространенным 
фактором, способствующим кибервторжениям в защищенные сети, является 
действие, предпринятое авторизованным пользователем компьютерной сис- 
темы в этой сети. Во многих случаях это действие заключается в простом 
щелчке мышью по ссылке в электронном письме, которая указывает на инте- 
ресующую получателя тему. Это может привести к установке вредоносного 
ПО, которое быстро распространяется по предположительно защищенной се- 
ти. В других случаях, например из-за недовольства условиями работы, поль- 
зователь намеренно предпринимает шаги, позволяющие злоумышленникам 
проникнуть в сеть. В любом случае злоумышленники взламывают сеть, полу- 
чая точку опоры, которая дает им возможность и далее использовать предпо- 
ложительно безопасную сеть в своих целях. Как только злоумышленники 
достигнут этого уровня доступа, они могут предпринять любые действия, ко- 
торые пожелают, включая извлечение конфиденциальной информации о 
компании или установку программ-вымогателей в критически важных ком- 
пьютерных системах. 


По состоянию на 2021 г. программы-вымогатели являются наиболее распростра- 
ненным вредоносным ПО для частных лиц, предприятий и других организаций. 


Методы кибератак 


Независимо от факторов, мотивирующих кибер-злоумышленников, они использу- 
ют несколько общих типов атак на компьютерные системы, будь то веб-сервер, 
промышленная система управления или ПК, принадлежащий отдельному лицу. 
Ниже перечислены некоторые из наиболее вероятных типов атак. 


Фишинг. Это слово обозначает основанные на использовании электронной 
почты попытки убедить получателя предпринять какие-либо действия, кото- 
рые будут способствовать достижению целей злоумышленника. В электрон- 
ном письме может содержаться просьба к получателю перейти по ссылке 
или, возможно, загрузить и открыть файл, а иногда просто ответить отправи- 
телю в случае интереса к теме исходного электронного письма. В большинст- 
ве случаев целью фишинга является побудить получателя к каким-либо дей- 
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ствиям, которые приведут к установке вредоносного ПО, предоставляющего 
отправителю контроль над компьютером получателя. 


е Ботнеты. Ботнет (от англ. гобо! пейло’к — сеть роботов) или бот-сеть — это 
совокупность компьютеров, которые были заражены вредоносным ПО и на- 
ходятся под управлением одного злоумышленника. Этого управляющего на- 
зывают бот-мастером. Компьютерам, входящим в ботнет, можно поручать 
выполнение злонамеренных задач, таких как рассылка фишинговых электрон- 
ных писем в попытке привлечь в ботнет больше участников или проведение 
атак типа отказ в обслуживании (Чета! оЁ зегусе, Оо5), когда компьютеры — 
участники ботнета пытаются перегрузить веб-сайты одновременной отправкой 
множества запросов на обслуживание. 


е Атаки со взломом паролей. В большинстве компьютерных систем пароли, 
которые пользователи вводят для входа в систему, хранятся не в том форма- 
те, в котором они вводятся с клавиатуры. Вместо этого пароли передаются с 
помощью криптографического алгоритма хеширования, который преобразует 
пароль в неузнаваемую строку двоичных данных. 


Важные особенности криптографического хеш-алгоритма заключаются в том, 
что ввод одного и того же пароля всегда приводит к получению одного и того 
же хеш-значения, но знание этого хеш-значения не дает злоумышленнику 
простого способа определить соответствующий пароль. Несмотря на то что 
обладание хеш-значением пароля не позволяет напрямую определить пароль, 
злоумышленники все же могут найти пароль пользователя по его хеш- 
значению. Стандартный подход к определению пароля пользователя при из- 
вестном значении хеш-функции заключается в простом переборе всех воз- 
можных паролей, пока не будет найдено соответствующее хеш-значение. 
Этот метод называется взломом пароля методом полного перебора. Луч- 
шей защитой от такого типа атак является использование длинных паролей 
(15 символов или более) со смешанным набором символов верхнего и нижне- 
го регистра, а также некоторых специальных символов, таких как * и &. 
Короткие пароли (менее 10 символов) или пароли, которые можно найти 
в словаре, довольно легко взломать, как и такие, к сожалению, достаточно 
распространенные пароли, как 123456, дмегфу или ра$$мога1. 


е Использование уязвимостей. Исследователи систем безопасности (белые 
хакеры) и хакеры-злоумышленники (черные хакеры) прилагают огромные 
усилия для обнаружения уязвимостей кибербезопасности в существующих 
операционных системах, приложениях, веб-сайтах и мобильных устройствах. 
Белые хакеры преследуют цель повышения уровня кибербезопасности для 
всех. Сначала они информируют разработчика об уязвимой системе или при- 
ложении, а затем, по прошествии времени, необходимого для устранения 
уязвимости, публикуют информацию о ней для всеобщего обозрения. Белые 
хакеры руководствуются не только альтруистическими мотивами — обнару- 
жение критической уязвимости в крупной программной системе может при- 
вести к известности, повышению репутации и уважению со стороны коллег- 
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исследователей. Черные хакеры используют любую уязвимость, которую они 
обнаруживают, для совершения преступных действий против компьютеров, 
которые восприимчивы к такой атаке. Часто только после того, как системы 
были атакованы с использованием ранее неизвестной уязвимости, разработ- 
чики систем и независимые исследователи (белые хакеры) анализируют вре- 
доносное ПО-нарушитель и обнаруживают уязвимость в целевой системе. 


Уязвимости классифицируются по времени (в днях), в течение которого системные 
администраторы и пользователи должны подготовить средства защиты от вновь 
обнаруженной уязвимости, прежде чем эта уязвимость будет использована для ата- 
ки. В худшем сценарии для владельцев и пользователей уязвимой компьютерной 
системы атаки могут начаться вообще без предупреждения. В этом случае уязви- 
мость называют уязвимостью нулевого дня — это означает, что никакого преду- 
преждения о нападении заранее не было. 


Типы вредоносного программного обеспечения 


Вредоносным называют программное обеспечение, установленное в компьютерной 
системе без разрешения владельца и пытающееся выполнять действия, нежелатель- 
ные для владельца компьютера. 


Вредоносное ПО (та\аге, МА с1ои$ зоЯ\АВЕ) — это категория программ, ко- 
торые выполняют нежелательные действия и часто мешают нормальной работе 
компьютера. Ниже перечислены некоторые из наиболее распространенных типов 
вредоносных программ. 


» Шпионское ПО — это программное обеспечение, которое извлекает личную 
информацию о пользователе компьютера и другие ценные данные и передает 
их злоумышленнику. К такой информации относятся имена пользователей и 
пароли для учетных записей интернет-сервисов и адреса посещенных веб- 
сайтов. Шпионские программы могут использовать эту информацию для ото- 
бражения всплывающих рекламных объявлений, ориентированных на пред- 
полагаемые интересы пользователя. Тактика шпионских программ аналогич- 
на методам, обычно применяемым в рекламе законопослушными 
компаниями, поэтому отнесение части очевидных шпионских программ к 
вредоносному ПО может оказаться непростой задачей. 


е Программы-вымогатели. Как указывалось ранее в этой главе, программы- 
вымогатели чаще всего шифруют файлы данных пользователя, а затем тре- 
буют оплаты в обмен на предоставление ключа для расшифровки данных. 
Другой формой вымогательства с помощью программ является кража личной 
информации физического лица или конфиденциальной информации компа- 
нии и требование оплаты для предотвращения ее публичного раскрытия. 
Атаки программ-вымогателей часто нацелены на предприятия и организации, 
такие как больницы. Использующие эти методы злоумышленники обычно 
требуют оплаты в криптовалюте, которую, по их мнению, невозможно отсле- 
дить. Несмотря на то что во многих случаях выплата выкупа приводит к ус- 
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пешной расшифровке зашифрованных данных или отказу от публичного рас- 
пространения частной информации, нет никаких гарантий, что такая выплата 
приведет к благоприятному для жертвы исходу. 


е Вирусы. Подобно биологическому вирусу, программный вирус размножает- 
ся, заражая другие компьютеры собственными копиями. Помимо выполнения 
функций шпионского ПО или программы-вымогателя либо реализации кибе- 
ратаки в какой-либо иной форме, вирус содержит код, который пытается по- 
лучить по сети доступ к другим компьютерным системам и установить на 
них свои копии. Вирус внедряется в существующую компьютерную про- 
грамму путем внесения в нее изменений для добавления вирусного кода. По- 
сле этого измененная программа становится носителем вируса и предприни- 
мает попытки заразить другие компьютеры. Программу, которая была 
изменена путем включения в нее вируса, называют зараженной вирусом. 
Требование репликации через программное приложение-носитель отличает 
компьютерный вирус от червя, которому для этой цели приложение-носитель 
не требуется. 


» Черви. Подобно вирусу, компьютерный червь представляет собой автоном- 
ную программу, которая пытается размножиться путем установки своих ко- 
пий на другие компьютеры, доступные по сети. Червю, в отличие от компью- 
терного вируса, не требуется зараженное приложение-носитель. Как и вирус, 
червь может содержать код, который действует как шпионское ПО или про- 
грамма-вымогатель или реализует атаку какого-либо другого типа. 


е "Человек посередине" (тап т е пе, МТТМ). В атаках этого типа зло- 
умышленник пытается разместить программное обеспечение на пути обмена 
данными между двумя взаимодействующими приложениями или компьюте- 
рами. В случае успеха такая атака позволяет злоумышленнику перехватить 
конфиденциальную информацию, например имена пользователей и пароли, 
а также изменять данные по мере их передачи между взаимодействующими 
узлами. 


» Отказ в обслуживании (4еша| о? зегусе, о5). При атаке этого типа целевая 
система, например веб-сервер, подвергается бомбардировке огромным коли- 
чеством ложных запросов. Цель атаки — сделать целевую систему недоступ- 
ной для использования законными пользователями в течение длительного 
периода. Оо5-атаки популярны среди хактивистов, которые применяют этот 
подход для создания проблем и привлечения негативного внимания к пред- 
приятиям и другим организациям, которые являются объектами их гнева. 


е Внедрение ЗОГ-кода. Язык программирования баз данных Э#гисигед Оцегу 
Гаприаре (ОГ) часто используют в веб-приложениях для связи между поль- 
зовательским интерфейсом и базами данных, содержащими такую информацию, 
как учетные данные пользователей или сведения о продуктах для продажи 
через веб-сайт. Если разработчики веб-приложения проявят недостаточную 
осторожность в применении методов безопасного программирования, поль- 
зователи приложения могут получить возможность формировать входные 
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данные, воспринимаемые ЗОГ-интерпретатором как исполняемый код. В слу- 
чае успеха эта уязвимость позволяет злоумышленнику извлекать данные из 
базы данных и изменять их, а иногда приводит к более разрушительной атаке 
на сеть, в которой находится база данных. 


е Перехват нажатий клавиш. Клавиатурные шпионы относятся к типу вре- 
доносного ПО, которое записывает последовательность нажимаемых пользо- 
вателем компьютера клавиш и пересылает эту информацию злоумышленни- 
ку. Клавиатурный шпион может записывать важную личную информацию, 
такую как имена пользователей и пароли для банковских счетов и счетов 
кредитных карт. В более общем плане вредоносные программы этого типа 
могут выполнять такие функции, как сохранение снимков экрана с дисплея 
компьютера-жертвы и даже запись с видеокамеры и микрофона, подключен- 
ных к зараженному компьютеру или смартфону. Функции клавиатурного 
шпиона часто являются составной частью более крупного вредоносного ПО, 
содержащего шпионские программы, программы-вымогатели или вирусы. 


е Атаки на объекты инфраструктуры. Управление работой многих объектов 
крупномасштабной инфраструктуры, таких как электростанции, линии элек- 
тропередачи, плотины, нефтеперерабатывающие заводы и трубопроводы, ос- 
новано на компьютеризированных системах управления. По сложившейся 
традиции специализированные компьютеры, используемые для этих целей, 
обладали лишь самыми элементарными функциями безопасности. Специали- 
сты по кибербезопасности очень обеспокоены тем, что тщательно продуман- 
ные атаки на эти системы с помощью вредоносных программ могут привести 
к серьезным последствиям, таким как массовые отключения электроэнергии 
или взрывы на нефтеперерабатывающих заводах. 


Вредоносные программы некоторых типов сочетают в себе несколько подобных 
возможностей и способны выполнять такие действия, как проведение тщательного 
анализа только что зараженной системы, прежде чем принять решение о продолже- 
нии атаки. Предметом этого анализа могут быть такие факторы, как страна, в кото- 
рой находится зараженная система, компания, которой принадлежит система, 
и конкретные приложения, установленные на компьютере. 


Некоторые вредоносные программы попадают в компьютер в зашифрованном виде 
и выполняют расшифровку только по мере подготовки отдельных сегментов кода к 
выполнению. Цель шифрования кода состоит в том, чтобы максимально затруднить 
исследователям кибербезопасности изучение кода и понимание его назначения. 
Шифрование также может помочь вредоносному коду преодолеть автоматическую 
защиту, обеспечиваемую антивирусным программным обеспечением. 


Действия после проникновения 


После того как злоумышленник получает удаленный доступ к целевой системе, пе- 
ред ним открывается множество вариантов дальнейшего использования этой сис- 
темы, а также других компьютеров в той же сети. Одним из первых шагов, которые 
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злоумышленник обычно предпринимает после получения доступа к системе- 
жертве, является установка программ, обеспечивающих непрерывный доступ, даже 
если текущий авторизованный пользователь выходит из системы или система пере- 
загружается. При атаках многих типов этот шаг выполняется автоматически, как 
часть последовательности действий по первоначальному проникновению в компь- 
ютер-жертву. В других случаях злоумышленник, проводящий удаленное исследо- 
вание целевой системы, устанавливает этот код сразу после получения доступа. 


Первый вход злоумышленника в систему-жертву часто происходит на уровне при- 
вилегий пользователя, который выполнил действие, открывшее доступ, например 
щелкнул по ссылке, откуда была загружена и установлена вредоносная программа. 
Многие виды вредоносной деятельности требуют лишь ограниченного уровня при- 
вилегий обычного пользователя. Примерами этого являются программы- 
вымогатели, которые шифруют файлы данных пользователя, или ботнеты, которые 
бомбардируют целевой веб-сервер запросами, используя ограниченные привиле- 
гии, доступные обычному пользователю. 


Атаки некоторых типов, например попытки получить доступ к защищенным сведе- 
ниям в базе данных, содержащей информацию о клиентах, требуют привилегий 
уровня администратора. Следующим шагом после получения доступа к компью- 
терной системе на уровне непривилегированного пользователя и установки про- 
граммы, обеспечивающей непрерывную связь между злоумышленником и систе- 
мой-жертвой, может быть попытка перехода на более высокий уровень привилегий. 


Повышение уровня привилегий — это процесс, который злоумышленник ис- 
пользует для получения более высокого уровня привилегий в целевой системе, что- 
бы обеспечить себе доступ к системным ресурсам, таким как файлы и базы данных, 
которые недоступны обычным пользователям. 


Повышение уровня привилегий может быть достигнуто различными способами. 
В операционных системах, драйверах или приложениях, которые выполняются с бо- 
лее высокими уровнями привилегий, часто имеются известные уязвимости. Если 
система не обновляется регулярно путем установки пакетов исправлений известных 
ошибок, злоумышленники могут использовать эти уязвимости, чтобы повысить уро- 
вень своих привилегий и получить доступ к защищенным системным ресурсам. 


Обеспечив постоянное подключение к системе-жертве и обзаведясь привилегиями 
администратора, злоумышленник получает полный контроль над компьютером. Он 
может извлечь любые данные, хранящиеся на компьютере, и установить любое 
программное обеспечение, которое пожелает. В хакерской терминологии компьютер, 
находящийся под полным административным контролем удаленного злоумышлен- 
ника, считается захваченным (о\пе4) этим злоумышленником. Если злоумышлен- 
ник достиг такого уровня контроля незаметно для законных пользователей или 
программного обеспечения, такого как антивирусные инструменты, то на хакер- 
ском сленге такая атака называется совершенным захватом (ре[ес{ о\п), сокра- 
щенно ру (произносится как "поун"). 


Одно из ограничений, о котором злоумышленник обычно должен помнить, — это 
необходимость избегать того, чтобы факт заражения компьютера вредоносным ПО 
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был слишком очевиден для его законных пользователей. Большинство пользовате- 
лей не слишком беспокоит, если их компьютер работает немного медленнее, чем 
обычно, но появление на экране окна, в котором отображаются вводимые зло- 
умышленником команды, позволит любому догадаться о том, что система была 
взломана. Изощренные злоумышленники стараются избегать действий, которые 
выдают их присутствие жертвам атак. 


В этом разделе представлен обзор некоторых наиболее распространенных катего- 
рий и методов реализации угроз кибербезопасности. Приведенный список методов 
и типов вредоносных программ не является исчерпывающим, кроме того, постоян- 
но разрабатываются новые способы атак на цифровые системы и устройства. Для 
архитектора компьютерных систем недостаточно понимать типы кибератак, кото- 
рые были распространены в прошлом. Крайне важно иметь представление обо всем 
спектре атак, включая теоретически возможные, даже если некоторые из них ранее 
не наблюдались. В следующем разделе будет рассмотрен ряд ключевых функций, 
которые должны быть реализованы в вычислительных устройствах, чтобы обеспе- 
чить поддержание высокого уровня безопасности системы и ее интерфейсов с дру- 
гими сетями, пользователями и устройствами в течение всего срока службы. 


Особенности защищенного оборудования 


В начале проектирования нового компьютера или цифрового устройства или при 
пересмотре проекта существующей системы крайне важно, чтобы разработчик 
компьютерной архитектуры рассматривал безопасность как требование высшего 
уровня. Даже самые элементарные решения в процессе разработки, такие как выбор 
модели процессора, скорее всего окажут заметное влияние на безопасность конеч- 
ного изделия. На первом этапе этого процесса необходимо понять, какие типы дан- 
ных и другой информации, связанной с технологиями, должны быть защищены от 
раскрытия лицам, не имеющим надлежащих полномочий. 


Определите, что нуждается в защите 
Ниже перечислены некоторые типы информации, хранящейся на компьютерах и в 
сетях, которая обычно нуждается в защите от несанкционированного раскрытия: 


» личные данные, такие как пароли, номера социального страхования, финан- 
совые данные и история болезни; 

» конфиденциальная информация, принадлежащая предприятию, включая спи- 
ски клиентов, данные о конструкции изделий и стратегические планы; 

» запатентованные технологии, например конструкция цифровых схем в 
смартфоне; 


» правительственная информация, например информация о национальной обо- 
роне и разведывательные данные, собранные правоохранительными органами. 
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При проектировании конкретной системы архитектор компьютеров должен постоян- 
но помнить о типах информации, которую необходимо защитить. Это касается циф- 
ровых данных, содержащихся в системе, а также аппаратных средств, которые могут 
содержать уязвимости, предоставляющие злоумышленникам доступ к устройству. 


Анализ безопасности системы должен включать в себя оценку уровня физического 
доступа к системе со стороны потенциальных злоумышленников. Что касается обо- 
рудования, предоставляемого в распоряжение конечных пользователей, такого как 
персональные компьютеры и смартфоны, пользователи могут совершать любые 
желаемые действия с этим оборудованием, включая его разборку и изучение ком- 
понентов под микроскопом. 


Для оборудования, рассчитанного на работу в контролируемой среде, такой как 
ферма облачных серверов, защита от прямых физических атак может представлять 
меньшую проблему. Однако, учитывая возможность атак со стороны злонамерен- 
ных инсайдеров, необходимо подумать о том, чтобы как минимум обнаруживать 
случаи недопустимого вмешательства, даже если такое вмешательство является 
результатом действий сотрудников с благими намерениями. 


Особой категорией интеллектуальной собственности, заслуживающей защиты, яв- 
ляются встроенное ПО и программный код в устройствах, поставляемых пользова- 
телям. Если производитель желает сохранить этот код в коммерческой тайне, про- 
цесс разработки должен включать действия по защите кода и предотвращению его 
раскрытия даже самыми умелыми и способными злоумышленниками. 


Рассматривайте все типы атак 


При проектировании функций безопасности цифровой системы важно учитывать 
не только типы атак, которые наблюдались в прошлом. 


Архитектор должен широко оценивать ситуацию для определения категорий атак, 
которые еще не были замечены, но могут быть осуществлены, хотя бы теоретиче- 
ски. Такое мышление может привести к выявлению технологий, которые, вероят- 
нее всего, не представляют особой угрозы в ближайшей перспективе (например, 
квантовые вычисления), но тем не менее могут быть эффективно нейтрализованы 
при приемлемых затратах ресурсов. 


Вычислительную среду компьютерных систем, которым не требуется доступ к Ин- 
тернету или к другим внешним сетям, обычно конструируют таким образом, чтобы 
обеспечить изоляцию от соединений с внешними сетями. Такую конфигурацию 
называют изолированной. Это означает, что между компьютерным оборудованием 
и любым потенциальным подключением к внешним сетям существует физическое 
разделение. 


Построение физически изолированных вычислительных сред теоретически обеспе- 
чивает существенное повышение безопасности, однако в реальности преимущества 
этой архитектуры оказались ограничены. Для того чтобы любая компьютерная сис- 
тема сохраняла существенную ценность, обычно необходимо регулярно передавать 
в эту систему информацию в виде обновлений программного обеспечения и ис- 
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пользуемых на компьютере данных. Для изолированных систем эти обновления 
обычно поставляются на оптических дисках или портативных дисковых накопите- 
лях. Несмотря на благие намерения и усилия операторов систем, направленные на 
обеспечение безопасности, такой процесс передачи данных предоставляет удобную 
возможность для проникновения вредоносного ПО в защищаемую систему, а после 
заражения позволяет вредоносному ПО предпринимать попытки передачи данных 
из системы злоумышленникам и обратно, используя те же механизмы передачи. 


Продвинутые хакеры постоянно работают над развитием методов атак на изолиро- 
ванные компьютерные системы и другие вычислительные среды с высоким уров- 
нем безопасности. Разработчики защищенных вычислительных систем должны 
учитывать все возможности, которые злоумышленники могут использовать в своих 
попытках получить доступ к системе и эксплуатировать ее. Для создания надежной 
архитектуры крайне важен творческий подход. 


Все возможные формы доступа к информации и пути утечки данных являются за- 
конной добычей для преданного своему делу злоумышленника. Даже если в ком- 
пьютерной системе не предусмотрена возможность подключения к доступной из- 
вне сети, для решительного противника могут оказаться жизнеспособными другие 
потенциально экзотические атаки. Кибератаки, позволяющие передавать данные 
между процессами, в которых не предусмотрена возможность обмена данными, 
называются атаками через скрытые каналы. Ниже перечислены некоторые уди- 
вительные типы атак, которые продемонстрировали по крайней мере некоторую 
степень успеха. 


е "Простукивание строк". Было показано, что современные устройства памя- 
ти ОКАМ, рассмотренные в предыдущих главах, уязвимы для атак, называе- 
мых простукиванием строк (го\/ Баттег). Слово "строка" в названии атаки 
относится к строкам битовых ячеек в устройстве памяти ОКАМ. Благодаря 
крошечному размеру каждой битовой ячейки и ее близости к соседним ячей- 
кам в той же строке и в соседних строках при определенных условиях появ- 
ляется возможность изменять состояние ("инвертировать биты") ячеек, нахо- 
дящихся в соседних строках. 


Для того чтобы вызвать этот эффект, код с высокой скоростью выполняет по- 
вторяющиеся обращения к целевой строке ОКАМ. Для того чтобы атака была 
успешной, выполняющий ее код должен гарантировать, что его запросы на 
доступ к памяти приводят к кеш-промахам, при которых задействуются внут- 
ренние схемы ОКАМ. Атаки типа "простукивание строк" продемонстрирова- 
ли возможность добиться повышения уровня привилегий на компьютерах, 
основанных на архитектуре х86. 


» Колебания энергопотребления. Даже если злоумышленникам удастся уста- 
новить вредоносное ПО в изолированную компьютерную систему, извлече- 
ние собранных вредоносным ПО данных остается сложной задачей. Если не- 
возможно вывести информацию через накопители, используемые для 
переноса данных в изолированную систему и обратно, должен быть найден 
альтернативный метод. Исследователи продемонстрировали, что вредоносное 
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ПО, запущенное в целевой компьютерной системе, может создавать колеба- 
ния энергопотребления в электросети здания, которые можно отслеживать на 
линиях электропередачи за пределами здания. Тщательно закодировав циф- 
ровые данные в эти колебания, злоумышленники могут извлекать информа- 
цию из изолированного компьютера. 


е Колебания температуры. Современные компьютеры оснащены вентилято- 
рами, а иногда и системами жидкостного охлаждения, чтобы регулировать 
температуру системы и поддерживать ее в заданных пределах. Когда компь- 
ютеры расположены близко друг к другу, температура одного компьютера 
может влиять на показания температуры соседнего компьютера. Предполо- 
жим, что вредоносное ПО установлено на двух близко расположенных ком- 
пьютерах, один из которых находится в изолированной сети, а другой под- 
ключен к внешней сети. Было продемонстрировано, что преднамеренное 
изменение температуры на одном компьютере путем загрузки его процессора 
может вызывать измеримые изменения температуры на соседнем компьюте- 
ре. Используя этот метод, вредоносное ПО на изолированном компьютере 
может передавать цифровые данные на компьютер, подключенный к внеш- 
ней сети. Таким же образом можно передавать данные в противоположном 
направлении. Этот метод предлагает чрезвычайно малую скорость передачи 
данных, однако он позволяет передавать критически важные сведения, такие 
как ключи шифрования, которые могут быть использованы для обеспечения 
дальнейших атак. 


» Электромагнитное излучение. Когда электрический ток протекает по про- 
воднику, такому как ОЗВ-кабель, или по дорожке на печатной плате, в окру- 
жающую среду излучается электромагнитная волна. Если злоумышленник 
может разместить приемную антенну в пределах досягаемости этого сигнала, 
он получает возможность собирать передаваемую таким образом информа- 
цию. Конечно, в среде с высоким уровнем электрических помех, где одно- 
временно работает множество компьютеров, может быть исключительно 
трудно извлечь сигнал, излучаемый какой-либо одной системой. Однако, ес- 
ли вредоносное ПО присутствует на целевом компьютере, оно может пред- 
принять действия для преднамеренного генерирования электромагнитных 
колебаний по схеме, которая может быть обнаружена и декодирована подхо- 
дящей системой приема. Случались и более странные вещи. 


В этом разделе были представлены некоторые примеры экзотических атак, кото- 
рым может подвергнуться критически важная компьютерная система. Этот список 
атак ни в коем случае не является полным, однако он содержит примеры угроз, ко- 
торые системный архитектор должен учитывать при проектировании защищенной 
системы. 


Особенности конструкции защищенных систем 


Учитывая приведенные выше примеры возможных атак, мы можем выделить неко- 
торые важные особенности, которые должны быть реализованы в аппаратных сред- 
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ствах защищенной компьютерной системы, чтобы обеспечить высокий уровень га- 
рантий безопасности. 


Надежное хранение ключей 


Любые криптографические ключи, используемые системой для защиты данных, 
должны храниться таким образом, чтобы предотвратить их извлечение любыми 
мыслимыми способами. Обычно это означает, что ключи должны храниться в уст- 
ройстве, например в чипе процессора, таким образом, чтобы предотвратить их из- 
влечение любым программным методом. Это также означает принятие мер, пресе- 
кающих попытки извлечь ключи такими методами, как разборка интегральной 
схемы или использование сложных инструментов, таких как сканирующий элек- 
тронный микроскоп. 


Шифрование неактивных данных 


Любые данные, хранящиеся в системе, должны быть защищены, когда питание 
системы выключено. Это означает, что даже если оборудование было разобрано и 
содержимое отдельных устройств памяти извлечено злоумышленником, данные 
внутри них должны оставаться в безопасности. Наиболее распространенным мето- 
дом достижения такого уровня безопасности является шифрование данных с по- 
мощью ключа шифрования, который доступен для работы с данными в компьюте- 
ре, но полностью защищен от раскрытия вне пределов его предполагаемого 
использования. Один из способов хранения такого ключа — в специальных регист- 
рах процессора, доступ к которым закрыт даже для вредоносных программ, имею- 
щих повышенные привилегии. Многие современные процессоры, включая крошеч- 
ные встраиваемые устройства, начали оснащать тщательно продуманными 
криптографическими возможностями для этой цели. 


Шифрование данных при передаче 


Злоумышленник, имеющий физический доступ к каналу связи, может получить 
доступ к любым данным, передаваемым процессором или через интерфейс связи. 
Независимо от того, как передаются данные —- по дорожке печатной платы или че- 
рез глобальную сеть, любая конфиденциальная информация должна быть защище- 
на на всем пути от ее источника до места назначения. Как и в предыдущем случае, 
общим подходом для реализации этой защиты является использование шифрова- 
ния. Защита данных при передаче между двумя оконечными устройствами является 
более сложной задачей, чем шифрование и расшифровка данных в локальном хра- 
нилище, т. к. в этом случае шифрование и расшифровку необходимо выполнять в 
двух разных местах. 


Концептуально, наиболее простым методом достижения этой цели является пре- 
доставление ключа шифрования системам на обоих концах канала связи. Однако 
доставка секретного ключа в обе системы затруднена, если между ними еще нет 
защищенного канала связи. Стандартный подход, практикуемый сегодня для созда- 
ния безопасных каналов связи между системами, которые еще не имеют общего 
секретного ключа, заключается в применении шифрования с открытым ключом для 
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передачи секретного ключа с одного конца канала связи на другой. После этого 
секретный ключ используется для шифрования и расшифровки данных на каждом 
конце канала связи. Можно было бы просто применять процесс шифрования с от- 
крытым ключом для всех данных, совместно используемых системами, но оказыва- 
ется, что шифрование с открытым ключом требует гораздо больших вычислитель- 
ных затрат, чем работа с общим секретным ключом. 


Генерирование криптостойких ключей 


Когда требуется новый секретный ключ, например при создании безопасного кана- 
ла связи между двумя компьютерными системами, крайне важно, чтобы этот ключ 
был абсолютно непредсказуем для любых внешних злоумышленников. Любой 
вновь созданный секретный ключ должен выглядеть совершенно случайным и аб- 
солютно не связанным с любыми предыдущими или последующими ключами, соз- 
данными той же системой или другими системами. Традиционно самым простым 
способом создания на компьютере числа, имеющего случайный вид, было исполь- 
зование функций генерирования псевдослучайных чисел, доступных во многих 
библиотеках языков программирования. Однако оказалось, что последовательности 
чисел, создаваемые многими из этих алгоритмов, не дают результатов, похожих на 
случайные, и эти алгоритмические недостатки могут сделать задачу взлома алго- 
ритмов шифрования значительно более простой, чем может показаться при перво- 
начальном анализе. Современные криптографические генераторы случайных чисел 
используют специализированные аппаратные средства для создания истинных слу- 
чайных чисел, предлагая возможности генерирования максимально защищенных 
криптографических ключей. 


Процедура безопасной загрузки 


В безопасной системе весь код, выполняемый на повышенном уровне привилегий, 
необходимо проверить на подлинность, прежде чем будет разрешено его выполне- 
ние. Это относится ко всему коду, выполняемому в процессе загрузки, а также к 
ядру и драйверам операционной системы. Стандартным подходом для решения 
этой задачи является прикрепление к каждому фрагменту кода цифровой подписи. 
Цифровая подпись содержит зашифрованное хеш-значение, которое вычисляется 
для всего блока исполняемого кода, независимо от того, хранится ли он в виде фай- 
ла на диске или содержится во флеш-памяти процессора. Ключ, используемый для 
расшифровки хеш-значения цифровой подписи, должен храниться в аппаратных 
средствах процессора. При таком уровне защиты любая попытка заменить подлин- 
ный код на умышленно модифицированный потерпит неудачу, поскольку у зло- 
умышленника нет необходимого ключа, чтобы сформировать действительную 
цифровую подпись для измененного кода. 


Взломостойкая конструкция аппаратных средств 


Особенности защищенных компьютерных архитектур, описанные в этом разделе, 
в той или иной степени зависят от аппаратных средств процессора, способных на- 
дежно хранить секретную информацию, такую как криптографические ключи. Для 
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обеспечения долгосрочной защиты конфиденциальной информации, обрабатывае- 
мой компьютером, архитектура аппаратных средств должна оставаться защищен- 
ной от любых вероятных атак. Ниже перечислены отдельные примеры методов, 
которые злоумышленник может использовать, чтобы попытаться извлечь конфи- 
денциальную информацию, имея физический доступ к вычислительному устройству. 


» Физический доступ к устройству. Выполнив такие действия, как аккурат- 
ное вскрытие корпуса интегральной схемы с помощью шлифовки или хими- 
ческой эрозии, злоумышленник может получить доступ к внутренним компо- 
нентам схемы. Получив такой доступ, можно будет электрическим способом 
зондировать компоненты схемы и извлекать из них информацию. 


» Мониторинг электромагнитного излучения. Получив доступ к внутренним 
компонентам устройства, содержащего конфиденциальную информацию, 
можно использовать микроскопическую антенну для мониторинга активно- 
сти определенных компонентов или информации, проходящей через внут- 
ренние соединения. 


е Микроскопическое исследование. Для измерения распределения напряже- 
ния по поверхности схемы, например схемы массива памяти, можно исполь- 
зовать экзотические лабораторные приборы, такие как сканирующий микро- 
скоп напряжения. 


Применение некоторых из описанных в этом разделе методов атак против обычных 
компьютерных систем может показаться крайне маловероятным, однако вас может 
удивить то, насколько доступными могут быть эти методы. Хотя у большинства из 
нас нет собственного сканирующего микроскопа напряжения или доступа к такому 
устройству, имеются компании, которые владеют этими устройствами и готовы 
выполнить сканирование для клиентов за удивительно приемлемую цену. Это одна 
из причин, почему архитекторам компьютерных систем, которые должны содер- 
жать конфиденциальную или чрезвычайно ценную информацию, важно учитывать 
при их проектировании все возможные типы атак. 


В следующем разделе мы обсудим конфиденциальные вычисления, где применя- 
ются строгие меры безопасности для защиты данных на протяжении всего жизнен- 
ного цикла их обработки. 


Конфиденциальные вычисления 


Конфиденциальные вычисления — это недавняя разработка, целью которой явля- 
ется использование криптографии и средств защиты на аппаратном уровне для 
обеспечения постоянной защиты данных. Данные могут находиться в одном из 
трех состояний: в состоянии покоя, в движении или в обработке. Данные в со- 
стоянии покоя обычно хранятся в файлах на устройстве хранения данных. Дан- 
ные в движении — это данные, перемещаемые через коммуникационную среду 
какого-либо типа. Данные в обработке — это данные, активно обрабатываемые 
процессором и находящиеся в основной памяти процессора. 
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Конфиденциальные вычисления направлены на обеспечение всесторонней защи- 
ты данных во всех трех вышеуказанных состояниях. Традиционные механизмы 
безопасности в каждый момент времени сосредоточены на одном состоянии, на- 
пример на шифровании хранящихся на диске данных или на передаче информации 
на веб-сайт или с веб-сайта. Эти подходы пренебрегают необходимостью обеспе- 
чения такого же уровня защиты данных, находящихся в обработке. 


Защита данных в обработке требует поддержки со стороны аппаратных средств 
процессора для изоляции приложений друг от друга и обеспечения защиты конфи- 
денциального кода и данных. В качестве одного из примеров аппаратной поддерж- 
ки конфиденциальных вычислений можно привести технологию ш@| Зесиге Сиаг@а 
Ех(еп$1015 (СХ), которая обеспечивает надежную изоляцию приложений и защи- 
ту данных в обработке. 


| утверждает, что ЗС Х защищает данные приложений даже тогда, когда ВОЗ, 
операционная система и само приложение были взломаны, а злоумышленник полу- 
чил полный контроль над платформой. 


Технология ЗОСХ создает изолированные области памяти, называемые анклавами. 
Каждый анклав содержит неадресуемые области памяти, которые содержат код и 
данные приложения на зашифрованных страницах памяти. 


Приложения, созданные с использованием технологии 5СХ, состоят из двух час- 
тей: доверенной и общей. Общая часть приложения создает доверенную часть, ко- 
торая содержит защищенный анклав. Анклавы считаются доверенными, поскольку 
после создания изменить их нельзя. Если анклав был изменен, это изменение будет 
обнаружено, и его выполнение будет запрещено. Код, запущенный в доверенной 
части приложения, получает доступ к данным внутри анклава в виде открытого 
(нешифрованного) текста. Любому коду, находящемуся за пределами анклава, та- 
кому как код из В1О$, операционной системы или даже из общей части того же 
приложения, запрещен доступ к области памяти анклава. Даже внешний по отно- 
шению к анклаву код, который выполняется на уровне привилегий ядра, не может 
получить доступ к защищенным данным внутри анклава. 


Страницы памяти в защищенном анклаве могут быть вынесены во вторичное хра- 
нилище с использованием традиционных алгоритмов подкачки страниц. Когда за- 
щищенные страницы находятся в общем файле подкачки, шифрование кода и дан- 
ных внутри страниц анклава защищает информацию, которую они содержат. 


Технология 5СХ поддерживает концепцию аттестации программного обеспечения. 
Используя процедуру аттестации программного обеспечения, код, получающий 
удаленный доступ к функциям в защищенном анклаве, может проверить, что он 
взаимодействует с конкретным анклавом, с которым он намеревается работать, а не 
с подделкой. Процедура аттестации основана на обмене криптографическими циф- 
ровыми подписями для надежной проверки идентичности анклава. 


Конфиденциальные вычисления особенно хорошо применимы в контексте удален- 
ных вычислений. Термин "удаленные вычисления" описывает использование 
вычислительных ресурсов, которыми владеет и управляет недоверенная сторона, не 
являющаяся владельцем приложения. 
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Это описание применимо, например, к компании, которая использует поставщика 
облачных услуг для управления своими корпоративными вычислительными ресур- 
сами. Удаленное приложение может работать с конфиденциальными данными в 
недоверенной вычислительной среде и поддерживать их безопасность на всех эта- 
пах работы. 


Примером удаленных вычислений является коммерческий веб-сервер, запущенный 
в коммерческой облачной среде. Веб-приложение собирает и сохраняет конфиден- 
циальную информацию, такую как данные кредитных карт клиентов веб-сайта. Ис- 
пользуя технологию ОХ и другие стандартные криптографические методы, можно 
зашифровать конфиденциальные данные каждого клиента на компьютере пользо- 
вателя и перенести эти данные в защищенный анклав для обработки заказа. Для 
того чтобы обновить запись пользователя в базе данных приложения, конфиденци- 
альная информация шифруется в защищенном анклаве перед ее передачей в базу 
данных для хранения. В каждый момент времени после того, как пользователь ввел 
конфиденциальную информацию в своем браузере, эта информация имеет крипто- 
графическую защиту и защищена от злоумышленников, которые могли проникнуть 
в недоверенную вычислительную среду. 


Технология пе 5СХ была выпущена в 2015 г. и присутствует в большинстве со- 
временных процессоров [1]. Для того чтобы использовать эту технологию, ком- 
пьютерная система должна поддерживать базовую систему ввода вывода (ВОЗ), 
которая обеспечивает выполнение действий, необходимых для ее включения. Под- 
держка ЗСХ широко распространена в представленных сегодня на рынке материн- 
ских платах и компьютерах, но это не означает, что она доступна автоматически во 
всех системах. Если вы решите, что для вашего приложения требуется ЗСХ, вам 
необходимо убедиться, что процессор, материнская плата, ВОЗ и операционная 
система компьютера, который вы планируете использовать, поддерживают эту тех- 
нологию. 


К сожалению, как и во многих предыдущих попытках повысить уровень безопас- 
ности компьютерных систем с помощью аппаратных усовершенствований, иссле- 
дователи безопасности выявили уязвимости в технологии ЗОХ. Фактически, ис- 
следователи продемонстрировали возможность извлекать криптографические 
ключи и другую ценную информацию из приложений, работающих в защищен- 
ных анклавах СХ. 


Техника, которую злоумышленники используют против СХ, основана на функци- 
ях упреждающего (или внеочередного) выполнения, реализованных в современных 
процессорах. Как обсуждалось в главе 8, упреждающее выполнение — это метод 
оптимизации, при котором процессор начинает выполнять код по обеим ветвям, 
предусмотренным в инструкции ветвления, до тех пор, пока не станет ясно, какую 
ветвь выбрал код. При упреждающем выполнении в кеш-памяти сохраняются дан- 
ные, которые в конечном счете будут отброшены. Эти кешированные данные яв- 
ляются источником уязвимости. 


Данный конкретный метод атаки на 5СХ называют вводом загружаемого значе- 
ния (|оа4 уаше туесйоп, ГУТ). Атака ГУТ позволяет не только считывать значения 
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из предположительно защищенного анклава, но и вводить значения данных в анк- 
лав. {| определила действия, которые разработчики ПО могут предпринять для 
устранения угрозы Г/У]-атаки, однако эти меры могут оказать существенное влия- 
ние на производительность при выполнении программ. [П\е! также работает над 
обновлением микрокода процессора, которое устранит эту уязвимость. 


Меры безопасности на уровне архитектуры 


В процессе проектирования надежно защищенной компьютерной системы необхо- 
димо с самого начала учитывать широкий спектр требований к безопасности. Все 
аспекты проектирования системы, такие как выбор процессора и характеристик пе- 
чатных плат, должны оцениваться в свете того, как эти компоненты могут улуч- 
шить или ухудшить общую безопасность системы. 


Помимо обеспечения безопасности на самом низком уровне — уровне интеграль- 
ных схем и печатных плат, также важно применять принципы безопасного проек- 
тирования и на других уровнях. Например, после выбора надлежащим образом за- 
щищенных цифровых компонентов и разработки ориентированной на безопасность 
топологии схемы цифрового устройства может потребоваться разработать взломо- 
стойкий корпус для печатной платы. Корпус может содержать прикрепленные к его 
поверхности проводники, позволяющие обнаружить попытки злоумышленника вы- 
резать или просверлить в корпусе отверстие и тем самым получить доступ к внут- 
ренним компонентам. Этот подход часто используется в критически важных с фи- 
нансовой точки зрения устройствах конечного пользователя, таких как считыватели 
кредитных карт в торговых точках. 


Наилучшая защита системы обеспечивается применением методики безопасного 
проектирования на всех уровнях архитектуры системы как в аппаратных средствах, 
так и в программном обеспечении. В следующих разделах будут рассмотрены не- 
которые принципы проектирования, помогающие в создании безопасных систем. 


Избегайте защиты посредством сокрытия информации 


Один из заманчивых подходов, который годами использовался при разработке 
цифровых систем, заключается в том, чтобы как можно больше усложнить опреде- 
ление типа и назначения различных компонентов и соединений внутри цифрового 
устройства. Типичным способом в рамках этого подхода может быть механическое 
удаление обозначений с некоторых интегральных схем в устройстве, чтобы затруд- 
нить их идентификацию тому, кто его анализирует. 


Другим способом скрыть функциональные возможности системы является нанесе- 
ние на печатную плату части дорожек явно бессмысленным образом. Цель здесь 
состоит в том, чтобы максимально затруднить изучение устройства и обратную 
разработку его конструкции. 


Термин "обратная разработка" уже давно используется для описания аналитиче- 
ского процесса, помогающего понять, как было сконструировано устройство или 
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ПО, без доступа к какой-либо документации, которая бы раскрывала процесс раз- 
работки. Существуют и законные причины для выполнения обратной разработки 
(например, при ремонте системы, для которой нет документации), но в данном слу- 
чае мы сосредоточены на применении этого процесса в неблаговидных целях. При- 
мером вредоносного применения обратной разработки могут послужить попытки 
получить доступ к такой конфиденциальной информации, как коммерческая тайна 
или защищенное авторским правом ПО, с преступными намерениями. 


Исторически сложилось так, что самый большой недостаток подхода с преднаме- 
ренным сокрытием деталей устройства ценных цифровых систем заключался в 
том, что разработчики систем недооценивали возможности и находчивость тех, 
кто проводил обратную разработку. Похоже, что проектировщики, которые пола- 
гались на процесс внесения неясностей, считали, что так как они сами никогда не 
взялись бы за крайне утомительную работу, которая необходима для анализа на- 
меренно вычурного и переусложненного устройства, никто другой не будет пы- 
таться это сделать. 


Известно много случаев, когда с помощью обратной разработки удавалось решать 
такие задачи, как идентификация отдельных сигналов, связанных с интерфейсом 
отладки, скрытым в сложной конструкции печатной платы. Заполучив информа- 
цию об этих соединениях, взломщики смогли подключить аппаратную систему 
отладки и извлечь весь защищенный код и другую информацию, содержащуюся в 
устройстве. 


Среди специалистов по разработке различных систем распространено мнение, что 
только они могут разобраться в конструкции и поведении такого сложного устрой- 
ства, а их понимание основано лишь на том, что у них есть доступ к системной до- 
кументации, недоступной для злоумышленников. Это предположение часто являет- 
ся неверным по двум следующим причинам. 


» Во-первых, многие взломщики, практикующие обратную разработку, очень 
умны и ориентированы на детали, что позволяет им методично сопоставлять 
функции и поведение системы на удивление полным образом. 


»е Во-вторых, было бы неразумно предполагать, что системная документация 
останется в безопасности и будет скрыта от злоумышленников в течение дли- 
тельного времени. Кибератаки и промышленный шпионаж, направленные 
против высокотехнологичных компаний, широко распространены. Существу- 
ет значительная вероятность того, что решительные злоумышленники в ка- 
кой-то момент получат доступ к некоторой или всей системной документа- 
ции. Эту вероятность следует учитывать при оценке использования подхода с 
внесением неясностей вместо применения проверенных механизмов безопас- 
ности для защиты критически важной информации. 


Отказавшись от подхода, заключающегося в использовании непрозрачных процес- 
сов проектирования, чтобы помешать злоумышленникам взломать систему, мы 
должны обратиться к эффективным и проверенным временем подходам безопасно- 
го проектирования, от которых можно ожидать надежной работы как сейчас, так и 
в будущем. 
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Комплексный подход к безопасному проектированию 


Используя концепции, рассмотренные ранее в этой главе, при проектировании на- 
дежно защищенной компьютерной системы необходимо применять комплексный 
подход, начиная с ее базовых компонентов и заканчивая конечными деталями. Это 
позволит обеспечить высочайший уровень безопасности. Там, где это осуществимо, 
следует использовать возможность математически доказать, что система безопасна 
по своему замыслу. В то же время доказать безопасность архитектуры системы во 
всех ее аспектах невозможно (поскольку даже для самого простого приложения 
обычно нельзя продемонстрировать безопасность математически), однако это мож- 
но попытаться сделать в отношении наиболее критических аспектов устройства 
системы, таких как процесс входа пользователя в систему. 


Определив все точки доступа, через которые киберпреступник может попытаться 
взломать систему, и показав реализацию комплексных мер безопасности в каждой 
из этих точек, разработчики могут продемонстрировать определенный уровень уве- 
ренности в защищенности системы от атак. Если требуется обеспечить высочай- 
ший уровень безопасности системы, этот анализ должен охватывать все возможные 
методы взлома, описанные ранее в этой главе, включая те, которые считаются наи- 
менее вероятными. 


Помимо учета соображений безопасности во всех аспектах конструкции аппарат- 
ных средств и программного обеспечения системы, важно обеспечить, чтобы поль- 
зователи системы работали с минимальным уровнем привилегий, который им не- 
обходим для выполнения своих должностных обязанностей. Это тема следующего 
раздела. 


Принцип наименьших привилегий 


Некоторым пользователям требуется привилегированный доступ для управления и 
обслуживания защищенной компьютерной системы, тогда как многим другим 
пользователям для выполнения своей работы требуются лишь минимальные при- 
вилегии обычного пользователя. Принцип наименьших привилегий обобщает идею о 
том, что привилегии каждого пользователя в компьютерной системе не должны 
превышать уровень, необходимый для выполнения его должностных обязанностей. 
Например, пользователь, которому требуется изучать и обновлять информацию в 
корпоративной базе данных, должен быть наделен привилегиями, необходимыми 
для выполнения этих задач, но он не должен иметь дополнительных привилегий, 
которые, например, требуются для системного администрирования, не входящего в 
круг его обязанностей. 


Принцип наименьших привилегий гарантирует, что пользователи имеют разреше- 
ния и права доступа, необходимые им для выполнения своей работы, но не более 
того. 


Когда пользователя переводят на другую работу или он увольняется, для организа- 
ции, заботящейся о безопасности, особенно важно скорректировать права доступа 
сотрудника сразу после изменения его обязанностей, чтобы гарантировать, что этот 
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сотрудник (который может быть недоволен, если его наказали или уволили) больше 
не имеет доступа к информации, не связанной с его работой. 


Для эффективного применения принципа наименьших привилегий требуется нечто 
большее, чем тщательный процесс проектирования с предоставлением минималь- 
ных привилегий пользователям и приложениям во время разработки системы. Сис- 
темные администраторы и операторы должны на постоянной основе контролиро- 
вать, чтобы всем новым приложениям и пользователям предоставлялись лишь 
минимальные уровни привилегий, необходимые для выполнения назначенных им 


функций. 


Архитектура нулевого доверия 


Традиционный подход к проектированию защищенной компьютерной системы, 
описанный в предыдущих разделах, основан на многоуровневой модели безопасно- 
сти, цель которой заключается в том, чтобы даже в случае сбоя определенной 
функции безопасности оставшихся уровней было достаточно для сохранения об- 
щей безопасности. 


Учитывая регулярное появление публикаций о широком спектре успешных атак, 
демонстрирующих полный провал предпринятых мер безопасности в системах, ко- 
торым доверяли защиту критически важных личных, коммерческих и правительст- 
венных данных, этот подход явно имеет некоторые ограничения. 


В традиционной модели безопасности границей зоны безопасности считается 
внешний периметр сети. Внутри этого уровня защиты обмен данными по внутрен- 
ней сети считается доверенным, а компьютерным системам и пользователям пре- 
доставляются многие типы доступа. 


В архитектурной модели нулевого доверия любое сообщение, которое поступает в 
компьютерную систему, содержащую защищенную информацию, должно рассмат- 
риваться как потенциально вредоносное. Запрос обрабатывается только после уста- 
новления подлинности его источника и подтверждения допустимости запрошенно- 
го действия. 


Агентство национальной безопасности (АНБ) США определило следующий на- 
бор руководящих принципов, которые необходимо применять при разработке ком- 
пьютерной архитектуры с нулевым доверием. 


е "Никогда не доверяй и всегда проверяй". Каждая компьютерная система, 
пользователь, сетевое устройство или другой источник данных в сети всегда 
должны рассматриваться как ненадежные. Каждый получатель пользователь- 
ских данных или другой потребитель данных должен явно устанавливать 
подлинность каждой части полученных входных данных. Кроме того, при 
предоставлении привилегий пользователям или приложениям следует при- 
держиваться принципа наименьших привилегий, который диктует, что пре- 
доставляются только минимально необходимые привилегии. 


е "Предполагай худшее". Всегда предполагайте, что в сеть проникли враж- 
дебные субъекты, и действуйте соответствующим образом. Это означает, что 
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ответом по умолчанию на любой ввод данных или запрос обслуживания яв- 
ляется игнорирование или отклонение запроса. Ответ возможен только после 
тщательной проверки источника и подтверждения допустимости запрошен- 
ного действия. Системные администраторы и автоматизированные средства 
должны постоянно отслеживать все аспекты конфигурации сети, выявлять 
попытки несанкционированного доступа или изменения конфигурации и 
оперативно принимать ответные меры, чтобы остановить любую вредонос- 
ную активность и восстановить одобренную рабочую конфигурацию. Все 
уместные действия пользователей, приложений и сетевой инфраструктуры 
должны регистрироваться и проверяться, чтобы быстро обнаружить любое 
отклонение от одобренных операций. 


е "Проверяй явно". Каждая попытка доступа пользователя или приложения к 
защищенным ресурсам требует отдельной операции проверки. Процесс про- 
верки должен затрагивать множество атрибутов запрашивающего пользова- 
теля или приложения для надежного установления подлинности источника 
запроса. Например, система может потребовать использования двухфактор- 
ной аутентификации, когда пользователь вставляет криптографически защи- 
щенную карту доступа в считывающее устройство, а затем вводит РГУ-код. 
Такая карта и РПИМ-код представляют собой два независимых атрибута, кото- 
рые обеспечивают аутентификацию в качестве доверенного пользователя. 


Для полной реализации архитектуры нулевого доверия требуется внедрение меха- 
низма принятия решений, который оценивает решения о предоставлении доступа в 
контексте всей имеющейся информации об отправителе запроса и пункте назначе- 
ния запроса. Помимо аутентификации отправителя запроса и проверки применения 
наименьшего уровня привилегий, механизм принятия решений должен учитывать 
любую дополнительную информацию, которая может указывать на повышенные 
риски, связанные с запросом. Дальнейшая обработка запроса пользователя разре- 
шается только после проверки всей доступной информации и определения того, что 
уровень риска, связанного с одобрением запроса, не превышает заранее установ- 
ленного порогового значения. 


В следующем разделе будут рассмотрены некоторые способы, благодаря которым 
слабые места в защите программного обеспечения, работающего на надлежащим 
образом защищенном оборудовании, могут привести к появлению уязвимостей в 
компьютерной системе. 


Обеспечение безопасности системного 
и прикладного ПО 


При разработке аппаратного уровня защищенной системы важно придерживаться 
безопасного и проверенного подхода к проектированию на всех уровнях архитек- 
туры программного обеспечения. Далее мы рассмотрим некоторые из способов, 
с помощью которых программный код может вносить уязвимости в защищенные 
компьютерные системы. 
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Общие слабые места программного обеспечения 


В этом разделе перечислены несколько категорий слабых мест программного обес- 
печения, которые традиционно вызывали серьезные проблемы с безопасностью в 
операционных системах, приложениях и веб-серверах. Эти уязвимости иногда воз- 
никают из-за того, что разработчики ПО делают предположения о поведении поль- 
зователя, которые оказываются неверными. В других случаях разработчики просто 
не осознают, что следование определенным шаблонам программного обеспечения 
ведет к созданию небезопасных конструкций. 


Некоторые из перечисленных далее методов, вероятно, применимы лишь в кон- 
кретных языках программирования, но разработчики ПО должны знать, что не- 
безопасный код можно создать на любом языке программирования. 


Вот список некоторых наиболее распространенных слабых мест программного 
обеспечения, которые наблюдались в последние годы. 


Переполнение буфера 


Переполнение буфера происходит, когда набор входных данных превышает объем 
памяти, выделенной для ввода, и избыточные данные перезаписывают участки па- 
мяти, которые могут содержать другие важные данные. Это традиционно было 
проблемой с программами, написанными на языках программирования С и С+-. 
В типичном сценарии программа предлагает пользователю ввести текстовую стро- 
ку, которая, как ожидается, будет короткой, например имя пользователя. 


Для приема входных данных разработчик может выделить буфер, например на 
80 символов, предполагая, что длина имени пользователя никогда не превысит это 
значение. Если код, обрабатывающий входные данные, принимает более 80 симво- 
лов и сохраняет их в памяти, данные по адресам за пределами 80-символьного бу- 
фера будут перезаписаны. В традиционных реализациях языка С входной буфер, 
скорее всего, будет расположен в стеке процессора. Путем ввода специально скон- 
струированной строки, злоумышленник может вставить нужный ему код, содер- 
жащий инструкции процессора, а также перезаписать адрес возврата для текущей 
функции, который хранится в стеке. Подменив адрес возврата адресом вредоносно- 
го кода, злоумышленник может выполнить любые инструкции, которые он пожела- 
ет, начиная с момента возврата из функции ввода. Первоначальной целью зло- 
умышленников обычно является попытка получить удаленный доступ к командной 
строке (также называемой командной оболочкой) системы-жертвы. По этой при- 
чине вводимый код, который выполняет взлом этого типа, вызывают кодом обо- 
лочки. 


Межсайтовое выполнение сценариев 


Межсайтовое выполнение сценариев — это уязвимость, характерная для веб- 
приложений. При атаке с ее использованием злоумышленник находит способ вне- 
дрения вредоносных исполняемых сценариев на веб-страницы, которые затем дос- 
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тавляются с заслуживающего доверия сайта его пользователям. Эти сценарии вы- 
полняются в контексте браузера жертвы и могут предпринимать такие действия, 
как пересылка злоумышленнику учетных данных жертвы для входа в систему (на- 
пример, файла сооке для авторизации). Благодаря этому злоумышленник может 
выдать себя за жертву на заслуживающем доверия веб-сайте и получить доступ к 
личной информации жертвы. Разработчикам программного обеспечения доступно 
несколько механизмов для проверки и очистки входных данных пользователей веб- 
сайта, которые эффективно предотвращают межсайтовое выполнение сценариев. 
К сожалению, не все веб-разработчики в полной мере используют эти функции 
безопасности, поэтому эта уязвимость продолжает существовать на многих веб-сайтах. 


Внедрение $О1-кода 


Как обсуждалось ранее в этой главе, многие веб-приложения используют базу дан- 
ных для хранения пользовательской информации, такой как имена пользователей, 
хешированные пароли и содержимое сайта, например сообщения пользователей и 
загруженные изображения. Многие сайты для работы с информацией в базе данных 
и добавления новых данных, вводимых пользователями, используют язык ЗОГ.. По- 
тенциальная уязвимость возникает, если пользователь намеренно вводит на сайте 
данные, которые могут быть интерпретированы как код ЗОГ, и сайту не удается 
очистить входные данные таким образом, чтобы предотвратить выполнение вве- 
денного пользователем кода. 


Например, этот серверный код извлекает имя пользователя, введенное в поле на 
веб-странице после того, как пользователь нажимает кнопку Отправить. 


+хЕУзегМате = ве{Кедие${5*г1пв("УзегМате"); 


На следующем этапе обработки простая реализация серверного кода может создать 
команду в синтаксисе ЗОГ, которая извлечет из базы данных запись, связанную с 
введенным именем пользователя: 


{хЕ541Сма = '$ЕЁЕСТ * РЕКОМ У$ег$ мпеге ЦзегМате = "' + &хзегМате + '"'; 


Например, если пользователь ввел в качестве имени пользователя Алиса, текстовая 
строка, содержащая результирующую команду ОГ, будет следующей: 


ЗЕСЕСТ * ЕВОМ Узег$ мпеге ЦзегМате = "Алиса" 


Затем сервер передает эту команду интерпретатору команд базы данных, и, если 
было указано действительное имя пользователя, будет возвращена запись данных 
пользователя. 


Проблема с этим подходом заключается в использовании текстовой строки, вве- 
денной пользователем непосредственно в командной строке ЗОГ. Злоумышленник 
может использовать синтаксис ЗОГ, для изменения поведения операции доступа к 
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базе данных. Например, вместо ввода действительного имени пользователя зло- 
умышленник может ввести следующую текстовую строку: 


ог 


Когда эта строка предоставляется в качестве имени пользователя, выполняется сле- 
дующая команда ЗОГ: 


ЗЕСЕСТ * ЕВОМ Изеге ипеге ИзегМате = "" ог ни_он 


Эта команда указывает базе данных вернуть все записи, где имя пользователя явля- 
ется пустой строкой (что крайне маловероятно) или где пустая строка равна пустой 
строке. Поскольку пустая строка всегда равна пустой строке, условие будет истин- 
ным для всех записей, и база данных вернет все содержащиеся в ней пользователь- 
ские записи. Если серверный код затем представит результаты выполнения этой 
ЗОГ-команды браузеру пользователя, злоумышленнику удастся извлечь всю поль- 
зовательскую базу данных этого веб-сайта. 


Этот сценарий может показаться малопонятным методом атаки на веб-сайт, но вы 
должны понимать, что многие веб-сайты, часто принадлежащие известным и высо- 
ко оцениваемым компаниям, становятся жертвами разрушительных атак, очень по- 
хожих на описанную здесь. 


Обход каталога 


Уязвимость с обходом каталога возникает, когда сетевое приложение, обычно веб- 
сервер, непреднамеренно предоставляет своим пользователям некоторую степень 
доступа к своей структуре каталогов. Обычно операторы сайта предоставляют 
пользователям доступ к подкаталогам ниже основного каталога приложения для 
извлечения данных, хранящихся в этих каталогах. Данная уязвимость может воз- 
никнуть, если логика веб-сервера позволяет пользователям переходить вверх на 
один или несколько уровней каталогов, использующих этот метод. 


В операционных системах У//т4о\$ и Глпих элемент пути к каталогу, состоящий из 
двух последовательных точек, означает переход в каталог более высокого уровня. 
Например, следующий ОВГ-адрес показывает, как попытаться получить файл, со- 
держащий зашифрованные пароли, в системе Глпих, работающей под управлением 
стандартного веб-сервера: 


ВЕЕР: //ммм.ехатр1е.сот/../../../../ефс/Падом 


В случае успеха посещение этого ОВГ-адреса с помощью браузера позволяет зло- 
умышленнику получить хешированные версии всех паролей в системе. Затем зло- 
умышленник может использовать методы взлома паролей методом полного пере- 
бора, чтобы попытаться восстановить пароли пользователей. 
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В этом разделе перечислены лишь некоторые из наиболее распространенных уяз- 
вимостей программного обеспечения, которые исторически использовались для 
нанесения серьезного ущерба компаниям и частным лицам, чья личная информация 
хранится в компьютерных системах. 


База данных под названием Общий каталог уязвимостей (соттоп \’еаКпез$ 
епитеганоп, С\Е), доступная по адресу В@рз://с\уе.тйге.ого/Лпдех.Вет1, содержит 
список слабых мест программного обеспечения и аппаратных средств, составлен- 
ный на основе данных, предоставленных пользователями по всему миру. В частно- 
сти, список из 25 наиболее опасных уязвимостей программного обеспечения досту- 
пен по адресу №@рб://сууе.тиге.ого/даа/4еЙ!опт$/1337.пат. Этот список 
содержит широкий обзор наблюдаемых в настоящее время уязвимостей программ- 
ного обеспечения, вызывающих серьезные проблемы безопасности. 


Проверка безопасности исходного кода 


Одним из способов быстро получить информацию о слабых местах имеющегося 
ПО является применение инструмента автоматической проверки безопасности ис- 
ходного кода для оценки кодовой базы и классификации выявленных в ней про- 
блем по степени серьезности. 


В зависимости от языка или языков программирования, используемых для написа- 
ния кода, можно найти бесплатные инструменты для выполнения такого сканиро- 
вания. При выборе бесплатного сканера исходного кода, который вы планируете 
применить, обязательно ознакомьтесь с отзывами пользователей и убедитесь в том, 
что это действительно полезный инструмент. Для некоторых языков программиро- 
вания может потребоваться приобретение инструмента проверки безопасности, ко- 
торый может оказаться довольно дорогим. 


Инструменты автоматической проверки безопасности могут выявлять многие кате- 
гории проблем в исходном коде, включая перечисленные выше слабые места, 
а также другие дефекты, указанные в базе данных С\УЕ. Эти инструменты также 
выявляют другие проблемы в коде, такие как наличие сомнительных функций и 
использование конструкций, снижающих производительность. 


Вместо того чтобы пытаться перечислить эти инструменты здесь, я предлагаю вам 
воспользоваться поиском в Интернете с целью найти инструменты автоматической 
проверки безопасности, ориентированные на языки, которые вы используете для 
своих приложений. 


Резюме 


В этой главе были представлены вычислительные архитектуры, подходящие для 
решения задач, требующих исключительных гарантий безопасности. Такой высо- 
кий уровень защиты востребован в критически важных областях, включая системы 
национальной безопасности и обработку финансовых транзакций. Эти системы 
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должны быть устойчивы к широкому спектру угроз кибербезопасности, в том числе 
к проникновению вредоносного кода, атакам через скрытые каналы и путем физи- 
ческого доступа к аппаратным средствам компьютеров. Темы, рассмотренные в 
этой главе, включали угрозы кибербезопасности, шифрование, цифровые подписи 
и архитектурные решения для защиты аппаратных средств и программного обеспе- 
чения. 


Прочитав эту главу, вы научились определять категории угроз кибербезопасности, 
с которыми может столкнуться система, и разбираться в способах обеспечения 
безопасности аппаратных средств современных компьютеров. Теперь вы знаете, 
как можно избежать брешей в безопасности системных архитектур и как защищен- 
ная компьютерная архитектура может помочь обеспечить безопасность в про- 
граммных приложениях. 


В следующей главе мы представим концепции, связанные с блокчейном, откры- 
тым, криптографически защищенным реестром, содержащим последовательность 
транзакций. В ней дается общий обзор процесса майнинга биткоинов и обсужда- 
ются аппаратные архитектуры компьютерных систем, подходящие для реализа- 
ции этого процесса. 


Упражнения 


1. Для всех своих учетных записей в Интернете, содержащих важные данные, на- 
стройте двухфакторную аутентификацию (где она поддерживается). К таким 
учетным записям относятся банковские счета, электронная почта, социальные 
сети, хранилища кода (если вы разработчик программного обеспечения), меди- 
цинские услуги и все остальное, что для вас ценно. На всех этапах этого про- 
цесса необходимо заручиться гарантией того, что вы используете информацию 
и программные приложения исключительно из надежных источников. 


2. Для тех своих учетных записей в Интернете, которые содержат ценную инфор- 
мацию, но могут быть защищены двухфакторной аутентификацией, создайте 
надежные пароли. Надежный пароль должен быть длинным (15 символов или 
более) и содержать прописные и строчные буквы, цифры и специальные симво- 
лы (например, ! "#$%&' ( ) * +). Для того чтобы отслеживать эти сложные 
пароли, установите и используйте надежное приложение для хранения паролей. 
Будьте осторожны при выборе такого приложения и тщательно выбирайте его 
источник. 


3. Обновите операционную систему, а также другие приложения и сервисы (на- 
пример, Лауа) на всех компьютерах и других устройствах, находящихся под 
вашим контролем. Это послужит гарантией, что новые функции безопасности, 
включенные в эти обновления, начнут работать для вашей защиты вскоре по- 
сле того, как станут доступны. Составьте план для продолжения регулярной 
установки обновлений по мере их выпуска, чтобы обеспечить свою защиту в 
будущем. 
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Архитектуры блокчейна 
и майнинга биткоинов 


Эта глава начинается с краткого введения в концепции, связанные с блокчейном, 
открытым криптографически защищенным реестром, содержащим последова- 
тельность транзакций. За введением следует обзор процесса майнинга биткоинов, 
который добавляет транзакции в блокчейн Висош и вознаграждает тех, кто вы- 
полняет эту задачу, оплатой в биткоинах. Для обработки биткоинов требуется вы- 
сокопроизводительное вычислительное оборудование, которое представлено с 
точки зрения компьютерной архитектуры для майнинга биткоинов текущего по- 
коления. Глава завершается кратким введением в некоторые альтернативные бит- 
коину криптовалюты. 


После прочтения этой главы вы получите представление о концепции блокчейна и 
о том, как используется эта технология. Вы изучите этапы процесса майнинга бит- 
коинов и ознакомитесь с ключевыми характеристиками компьютерных архитектур 
для майнинга биткоина и особенностями некоторых популярных в настоящее время 
криптовалют. 


В этой главе будут представлены следующие темы: 
е введение в блокчейн и биткоин; 
» процесс майнинга биткоинов; 
® компьютерные архитектуры для майнинга биткоинов; 


»® альтернативные виды криптовалют. 
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Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 
№ рз://2ИвиБ.сот/РасКкЕРи БИ то/Модегп-Сотрщег-АгсВЦесеиге-ап9д- 
ОграпаНоп-Зесоп4-ЕФ@оп. 


Введение в блокчейн и биткоин 


Концепция биткоина впервые стала достоянием общественности в статье Сатоши 
Накамото (Заюз$в! МаКатою), вышедшей в 2008 г. под названием "Висош: пиринго- 
вая электронная денежная система" ("Висош: А Реег-ю-Реег ЕИестотис СазЬ 
Бу$ет"). Имя автора, по-видимому, было псевдонимом, и личность автора (или 
авторов) статьи осталась неизвестной для публики. В статье излагались математи- 
ческая и криптографическая основы системы для выполнения децентрализованных 
финансовых транзакций. 


Функционирование централизованной финансовой системы зависит от таких орга- 
низаций, как правительства и банки, которые осуществляют мониторинг и кон- 
троль деятельности системы и регулируют то, что разрешено делать пользователям 
системы. 


Концепция биткоина не имеет централизованного регулятора и полностью полага- 
ется на равноправные сетевые узлы, конкурентное взаимодействие которых орга- 
низовано таким образом, чтобы поддерживать стабильную работу системы. Любой 
желающий может присоединиться к сети в качестве равноправного участника и не- 
медленно получить все привилегии, доступные другим участникам сети. 


Одна из важных особенностей сети ВИсош заключается в том, что отдельным ли- 
цам, использующим эту валюту, не обязательно верить в то, что все, кто взаимо- 
действует с экосистемой Висош, будут действовать честно или достойно. Если 
добропорядочные равноправные узлы контролируют большую часть вычислитель- 
ной мощности, доступной сети Висош, то пользователи могут быть уверены в на- 
дежности системы. 


Конечно, эта гарантия надежности основывается на допущении, что единственный 
реальный путь для злоумышленников взломать реестр биткоинов или извлечь дан- 
ные о содержащихся в нем транзакциях — это поставить под угрозу целостность 
системы, основанную на консенсусе. Если программная ошибка в коде системы 
Висош становится причиной уязвимости, которую могут использовать злоумыш- 
ленники, или если алгоритм шифрования, на который опирается система, оказыва- 
ется слабым, то могут существовать и другие способы взломать систему. 


Информация о транзакциях системы Висош хранится в блокчейне — распределен- 
ном реестре, содержащем криптографически защищенные записи обо всех транзак- 
циях, которые проводились с биткоинами с момента появления системы. Каждый 
равноправный узел сети может в любое время запросить и получить полную копию 
блокчейна. В ходе процесса ввода в работу только что присоединившегося к сети 


438 Глава 15 


равноправного участника новая система должна загрузить и проверить все транзак- 
ции блокчейна, начиная с самой первой, и до конца блокчейна и самого последнего 
добавленного блока. Это обязательный шаг для того, чтобы новый равноправный 
участник подтвердил все транзакции вплоть до текущего состояния блокчейна. 


Для хранения своих средств пользователи сети Вйсош полагаются на программные 
приложения, называемые цифровыми кошельками. Цифровой кошелек отслежи- 
вает баланс биткоинов своего владельца и помогает выполнять переводы другим 
пользователям сети Висо и получать переводы от них. 


В кошельке хранится секретный ключ, используемый владельцем для доступа к 
принадлежащим ему биткоин-средствам. Если хакер получит доступ к секретному 
ключу биткоин-кошелька, он сможет перевести хранящиеся в кошельке средства 
куда пожелает. 


Когда пользователь сети ВИисош инициирует транзакцию для перевода некоторого 
количества биткоинов другому пользователю или получения биткоинов от него, 
в блокчейн должна быть добавлена запись об этом, которая помимо одобрения от- 
правителя транзакции должна быть проверена равноправными участниками сети. 


Сам блокчейн является общедоступным, но содержащаяся в нем информация не 
идентифицирует отправителя и получателя, участвующих в конкретной транзак- 
ции, каким-либо иным способом, кроме как путем предоставления цифрового клю- 
ча, связанного с цифровым кошельком конкретного пользователя. Этот номер не 
связан с личностью пользователя каким-либо иным образом кроме ситуации, когда 
тот же номер используется для транзакции с другим лицом, которому известна 
личность владельца данного кошелька. Для того чтобы избежать такой потери ано- 
нимности, пользователь при желании может создавать новый идентификатор ко- 
шелька для каждой новой транзакции. Благодаря этой частичной анонимности ки- 
берпреступники предпочитают использовать биткоин для таких целей, как 
получение выкупа, затребованного с помощью программ-вымогателей. 


Для того чтобы конвертировать некоторое количество биткоинов в более традици- 
онную валюту, такую как доллары США, или обратно, финансовое учреждение, 
уполномоченное работать в этой валюте, может выполнить эту транзакцию за 
определенную плату. В качестве альтернативы пользователь может перевести неко- 
торое количество биткоинов другому пользователю в обмен на взаимно согласо- 
ванное количество наличных денег. 


Каждая биткоин-транзакция влечет за собой небольшую (но необязательную) ко- 
миссию, выплачиваемую первому майнеру биткоинов, который успешно выполнит 
работу, необходимую для добавления набора транзакций от разных пользователей, 
включая транзакцию данного пользователя, в блокчейн. Сетевые узлы, которые 
выполняют эти вычисления, называют системами майнинга биткоинов, а людей, 
которые владеют выполняющими эту работу компьютерными системами и управ- 
ляют ими, называются майнерами биткоинов. Добровольное включение комиссии 
в каждую транзакцию повышает вероятность того, что майнеры включат транзак- 
цию в следующий блок, тем самым ускорив ее прохождение. 


Архитектуры блокчейна и майнинга биткоинов 439 


Добавление блока в блокчейн — это задача, намеренно требующая больших вы- 
числительных затрат. Узлы майнинга соревнуются за то, чтобы первыми успешно 
выполнить вычисления, необходимые для добавления блока в блокчейн. Первый 
узел, продемонстрировавший правильное решение для нового блока, получает ко- 
миссию, связанную с блоком, а также все комиссии, предлагаемые за транзакции, 
содержащиеся в данном блоке. Более подробно мы обсудим майнинг биткоинов 
позже в этой главе. 


Как следует из названия, блокчейн (ЫосКсваш) — это цепочка блоков. Каждый 
блок содержит криптографически защищенные описания множества биткоин- 
транзакций между пользователями сети. 


Начиная с первого блока, размещенного в начале цепочки при ее создании, каждый 
последующий блок содержит ссылку на блок, непосредственно предшествующий 
ему в цепочке. Криптографические методы используются для того, чтобы сохра- 
нить неизменными все блоки и транзакции внутри них, а также исключить возмож- 
ность подделки ссылок между блоками. 


На рис. 15.1 показано упрощенное представление конца цепочки блокчейна после 
добавления в нее нового блока с обозначением "Блок Х". Каждый блок содержит 
криптографически защищенные ссылки на сведения о каждой содержащейся в нем 
транзакции. 


Блок Х-2 Блок Х-1 Блок Х 


Хеш этого блока Хеш этого блока 


Хеш этого блока 


Батая | ии 


Рис. 15.1. Упрощенное представление блокчейна 


Хеш предыдущего блока 


Метка времени 


Одноразовый код 


Транзакция 0 


Транзакция 1 


Транзакция 2 


Транзакция т 


Каждый блок пронумерован для указания его места в цепочке. На момент написания 
этого текста в цепочке насчитывается более 700 000 блоков. Новый блок создается 
примерно каждые 10 минут. Блок содержит транзакции, которые были инициирова- 
ны в течение предыдущего интервала и собраны для формирования списка транзак- 
ций данного блока. Это означает, что для "клиринга" транзакции обычно требуется 
не менее 10 минут, используя аналогию с размещением чека на банковском счете. 
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Количество транзакций, включенных в каждый блок, меняется с течением времени в 
зависимости от объема транзакций, инициированных пользователями. 


Для данных каждого блока в сочетании с хешем предыдущего блока в цепочке вы- 
числяется криптографическая хеш-функция. Затем майнеры конкурируют, чтобы 
определить 32-битное значение (называемое одноразовым кодом (попсе)), которое 
может быть помещено в блок и позволяет получить хеш-значение блока, не превы- 
шающее в численном выражении целевого хеш-значения, предоставляемого про- 
граммным обеспечением сети Висош. Процесс добавления блоков в цепочку вклю- 
чает в себя сначала поиск одноразового кода, который обеспечивает выполнение 
условий сравнения с целевым хешем сети, затем публикацию нового блока в сети и, 
наконец, получение подтверждения от нескольких равноправных узлов о том, что 
новый блок на самом деле действителен. 


Целевой хеш сети Вцсош меняется с течением времени с целью поддержания ста- 
бильности обработки транзакций. Это означает, что объем работы, которую майнер 
должен выполнить, чтобы получить доход, меняется с течением времени и зависит 
от таких факторов, как объем вычислительной мощности для майнинга, задейство- 
ванный в настоящее время в сети. 


Поскольку сеть одноранговая, добавляемые блоки должны быть проверены равно- 
правными участниками сети с целью подтвердить, что каждый новый блок содер- 
жит одноразовый код, при котором хеш блока не превышает значения целевого хе- 
ша, и что содержащаяся в блоке информация в остальном верна. Как только между 
участниками будет достигнут консенсус о том, что блок действителен и что он стал 
победителем, т. е. первым блоком с действительным одноразовым кодом, этот блок 
добавляется в блокчейн. 


Архитектура блокчейна доказала свою надежность при наличии угроз безопасно- 
сти. Попытки вставить недействительные блоки в блокчейн легко обнаруживаются 
с помощью проверки хеша, и любые недействительные блоки отбрасываются. 


По замыслу системы в ней может быть создан только 21 млн биткоинов. На сего- 
дняшний день в обращении находится более 18 млн, осталось добыть менее 3 млн. 
По некоторым оценкам, чтобы добыть оставшиеся биткоины, потребуется более 
120 лет. 


В программном обеспечении Висош Соге предусмотрен ряд мер для поддержания 
стабильности сети и достижения цели ограничения общего количества биткоинов 
21 млн. 


» За счет изменения целевого хеша сети алгоритм пытается поддерживать 
10-минутный интервал создания блоков. Если бы майнинг каждого блока за- 
нимал ровно 10 минут, то за каждые две недели было бы добыто 2016 блоков 
(6 блоков в часх 24 часах 14 дней). Поскольку время майнинга для каждого 
блока меняется в зависимости от доступной в сети вычислительной мощно- 
сти, ПО Висош Соге с интервалом, соответствующим добавлению каждых 
2016 блоков, меняет целевой хеш на расчетное значение, при котором на 
майнинг предыдущих 2016 блоков ушло бы две недели. Затем этот целевой 
хеш используется для майнинга следующих 2016 блоков. 
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» 3 января 2009г. Сатоши Накамото добыл первый блок блокчейна сети 
Висот. Этот блок, которому был присвоен номер 0 в цепочке, называют пер- 
вичным блоком сети Висот. Вознаграждение майнера за этот блок составило 
50 биткоинов. Такое же вознаграждение было предоставлено майнерам пер- 
вых 210 000 блоков. Затем вознаграждение за блок было уменьшено вдвое, до 
25 биткоинов за следующие 210 000 блоков. Вознаграждение уменьшается 
вдвое после каждого последующего набора из 210 000 блоков. Если бы май- 
нинг каждого блока занимал ровно 10 минут, то на майнинг 210 000 блоков 
ушло бы четыре года. В 2021 г. вознаграждение за блок составляло 6,25 бит- 
коина, снизившееся вдвое с уровня в 12,5 биткоинов 11 мая 2020 г. Этот про- 
цесс деления пополам гарантирует, что общее количество биткоинов будет 
ограничено 21 млн. 


ТЕХНОЛОГИЯ БЛОКЧЕЙНА 


Сеть Висош использует технологию блокчейна для ведения криптогра- 
фически защищенного реестра биткоин-транзакций, но это не единст- 
и венное применение блокчейна. Блокчейн предоставляет более широкие 
\=> возможности, которые можно использовать в любой области, где необ- 
ходимо надежно отслеживать серию транзакций с течением времени. 
Например, блокчейн можно было бы использовать в библиотеке для 
записи событий выдачи и возврата книг. 


В самые первые дни майнинга биткоинов (май 2010 г.) майнер Ласло Ханеч (Г.а5210 
Напуес?7), как известно, купил две пиццы за 10 000 биткоинов. Похоже, это было 
первое использование данной криптовалюты для покупки физических товаров. Это 
событие стало рассматриваться как ключевой момент в развитии платежной систе- 
мы Висош и использовании ее распределенного реестра на основе блокчейна. На 
момент написания статьи 10 000 биткоинов могли стоить около 500 млн долларов. 


Подсчитано, что 4 млн биткоинов были безвозвратно потеряны их владельцами. 
Биткоины можно потерять, если владелец потеряет секретный ключ к кошельку, 
где они хранятся, например путем удаления всех копий этого ключа или посредст- 
вом уничтожения единственного жесткого диска, содержащего ключ. Потерянные 
биткоины по-прежнему принадлежат своему владельцу, но никто не может их вос- 
становить и использовать. 


Далее мы рассмотрим алгоритм безопасного хеширования, который обеспечивает 
сети Висош криптографическую защиту и формирует ядро процесса майнинга бит- 
коинов. 


Алгоритм хеширования ЗНА-256 


Фундаментальной операцией, лежащей в основе вычислений, используемых при 
майнинге биткоинов и многих других криптовалют, является безопасное хеширо- 


442 Глава 15 


вание. В качестве хеш-алгоритма в системе Висош используется ЗНА-256 — опуб- 
ликованный стандартный криптографический алгоритм хеширования, который был 
законодательно закреплен правительством США в Публикации 180-4 Федерального 
стандарта обработки информации (Еедега| пЮоппабноп Ргосеззтр З‘апдагаз, ЕТР5). 


ЭНА-256 работает с блоками данных, длина которых кратна 512 битам. Этот алго- 
ритм определяет процедуру добавления битов заполнения к данным для достиже- 
ния требуемой длины. 


Результатом вычисления ЗНА-256 является 256-битное хеш-значение, которое ча- 
ще всего представляется в виде 64 шестнадцатеричных символов. Ниже перечисле- 
ны наиболее важные особенности взаимосвязи между блоком входных данных и 
хеш-значением этого блока на выходе ЗНА-256. 


е Длина хеш-значения на выходе всегда равна 256 битам, независимо от разме- 
ра блока входных данных. Длина входных данных может быть меньше или 
намного больше 256 бит. 


» Вычисление хеш-значения конкретного блока данных с помощью алгоритма 
ЗНА-256 всегда дает один и тот же результат. 


» Изменение любой части блока данных, даже одного бита, обычно приводит к 
получению совершенно другого хеша ЗНА-256 по сравнению с хешем исход- 
ного блока данных. 


»е Теоретически возможно внести изменения в блок данных таким образом, 
чтобы в результате получить то же хеш-значение 5НА-256, что и для неизме- 
ненной исходной версии, однако на практике невозможно создать два разных 
блока данных, которые дают один и тот же результат хеширования с помо- 
щью алгоритма ЭНА-256. 


Когда хеширование двух разных блоков данных дает один и тот же результат, воз- 
никает хеш-конфликт. В сфере криптографических хеш-функций возможность 
конфликтов представляет собой угрозу безопасности. Эффективный и безопасный 
криптографический алгоритм хеширования должен гарантировать чрезвычайно 
низкую вероятность хеш-конфликтов. Для алгоритма ЗНА-256 мы можем считать 
вероятность хеш-конфликта астрономически малой величиной. 


Причина, по которой так трудно найти два разных блока данных, которые дадут 
одно и то же хеш-значение ЗНА-256, заключается в объеме работы, которую необ- 
ходимо выполнить для определения содержимого второго блока, чтобы его хеш 
совпадал с хешем первого блока. Прямолинейный подход к определению второго 
блока данных, который генерирует тот же хеш, что и первый блок, заключается в 
использовании процедуры голного перебора. 


Алгоритм полного перебора для поиска блока данных, соответствующего заданно- 
му (целевому) хеш-значению, может обрабатывать второй блок данных как после- 
довательность битов, которые мы интерпретируем как очень длинное целое число 
длиной 256 бит. Ниже приведен примерный порядок действий для поиска блока 
данных, который создает заданный хеш с использованием метода полного перебора: 


1. Ввести целевое хеш-значение, для которого следует подобрать блок данных. 
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2. Обнулить все биты в блоке данных. 
Вычислить хеш-значение блока данных с помощью алгоритма ЗНА-256. 


4. Совпадает ли вычисленный хеш блока с целевым хешем? Если да, выйти и ото- 
бразить соответствующий блок данных. Если нет, продолжить выполнение с 
шага 5. 


5. Увеличить целое число в блоке данных на единицу. 
6. Перейти к шагу 3. 


Описанный здесь алгоритм поиска хеш-конфликта методом перебора прост и в ко- 
нечном счете найдет соответствующее хеш-значение (если оно существует), однако 
совершенно нереалистично ожидать, что он когда-либо вернет полезный результат 


для хеша ЗНА-256 достаточно большого блока данных (длиной 256 бит или более). 


256 
Наш алгоритм поиска методом перебора должен выполнить цикл (шаги 3—6) 2 


раз, чтобы иметь почти достоверный шанс найти хеш-конфликт. Сколько времени 
это займет? Ответ включает в себя всю вычислительную мощность, доступную на 
Земле (сейчас и в будущем), и все время, оставшееся до того момента, когда погас- 
нет Солнце. При этом, весьма вероятно, что за это время не удастся сколько-нибудь 
заметно приблизиться к блоку данных, который даст нужное хеш-значение. 


Другими словами, учитывая текущее состояние вычислительных возможностей и 
разумные прогнозы относительно будущего роста этих возможностей, весьма веро- 
ятно, что в обозримой перспективе алгоритм ЗНА-256 не будет подвержен риску 
уязвимости из-за хеш-конфликтов, если, конечно, кто-то не обнаружит в нем дру- 
гую уязвимость. А в области криптографических алгоритмов такой риск существу- 
ет всегда. 


Далее мы рассмотрим порядок действий для вычисления хеша ЗНА-256 блока данных. 


Вычисление хеша ЗНА-256 


Алгоритм $НА-256 работает с блоком данных, который может иметь любую длину 
от 1 до 2°* — 1 бит. Блок данных, также называемый сообщением, в этом обсужде- 
нии рассматривается как линейная строка битов. 


Прежде всего сообщение дополняется до длины, кратной 512 битам, с использова- 
нием следующей процедуры. Дополнение сообщения выполняется, даже если дли- 
на исходного сообщения кратна 512 битам. 


|. Добавить 1 бит к сообщению. 


2. Добавить к сообщению минимальное количество нулевых битов таким образом, 
чтобы длина сообщения в битах была на 64 меньше, чем значение, кратное 512. 


3. Добавить к сообщению 64-битное целое число без знака, содержащее длину 
исходного сообщения в битах. 


Структурными элементами алгоритма ЗНА-256 являются простые логические и 
математические операции: И, ИЛИ, исключающее ИЛИ, НЕ, сложение целых чи- 
сел, сдвиг вправо, вращение вправо и объединение битов. Эти операции выполня- 
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ются над 32-битными словами. При выполнении сложения флаг переноса процес- 
сора игнорируется. 


Алгоритм ЭНА-256 определяет несколько более сложных операций, которые сме- 
шивают простые структурные элементы, упомянутые в предыдущем абзаце, с пре- 
допределенными константами для кодирования данных входного блока и получе- 
ния случайного на вид 256-битного значения в качестве выходного хеш-значения. 


Алгоритм ЗНА-256 обрабатывает каждую 512-битную секцию входных данных по- 
следовательно. После дополнения сообщения 512 бит каждой секции разделяются 
на 64 слова по 32 бита в каждом. Обработка каждой секции, по сути, представляет 
собой процедуру кодирования, которая многократно смешивает биты в словах по- 
средством серии логических операций. Алгоритм выполняет цикл из 64 проходов, 
содержащий серию интенсивных логических и математических операций над сло- 
вами данных в каждой секции. 


Подводя итог, можно сказать, что вычисление хеша ЗНА-256 даже для небольшого 
блока данных требует весьма значительной последовательности вычислений. В ал- 
горитме принципиально не существует коротких путей, которые позволили бы 
пропустить какой-либо из этапов вычислений. 


Пример входных и выходных данных ЗНА-256: входной блок данных, состоящий 
только из символов АЗСП абс, после дополнения и выполнения вычислительных 
операций ЗНА-256 даст на выходе следующие 64 шестнадцатеричные цифры в ка- 
честве хеш-значения: 


Ба78166+8+01с+еа4141404е54ае2223600361а396177а9с6410++61+20015аа 


В следующем разделе мы обсудим некоторые ключевые атрибуты исходного кода, 
на основе которого работает сеть Висотт. Этот код носит название Висот Соге. 


Программное обеспечение ВНсот Соге 


Любой, у кого есть компьютер и доступ в Интернет, может настроить у себя узел 
сети Висот. Для того чтобы получить полный доступ к возможностям, предлагае- 
мым сетью ВиИсош, владельцу компьютера необходимо настроить полный узел. 
Полный узел Висош выполняет операции, необходимые для проверки транзакций 
и блоков. Этот процесс включает в себя прием транзакций и блоков от других пол- 
ных узлов, проверку каждой транзакции и блока и пересылку блоков и результатов 
проверки другим полным узлам. 


Висош Соге имеет открытый исходный код, который можно загрузить по адресу 
ВЫрз:/Ьисотсоге.ого/еп/до\зушоад/. Этот код работает на компьютерных системах 
с ОС У\У/т9до\$, тасО$ Х и Глпих, которые удовлетворяют стандартным требовани- 
ям к памяти и дисковому пространству и имеют широкополосное подключение к 
Интернету. Исполняемые приложения Висот Соге можно загрузить и установить 
напрямую или сгенерировать их на основе исходного кода. 


После установки и запуска приложение Висош Соге загрузит весь блокчейн Висош 
с равноправных узлов, начиная с первичного блока и заканчивая самыми послед- 
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ними добавленными блоками. По состоянию на 2021 г. полный объем данных 
блокчейна составляет более 400 Гбайт. Приложение Висош Соге может удалить 
ранние блоки после того, как они будут проанализированы, чтобы освободить часть 
дискового пространства. Первоначальная загрузка и анализ ранних блоков необхо- 
димы для проверки всей истории блокчейна и подтверждения действительности и 
точности текущего состояния последних блоков. 


Если вы решите ограничить использование диска программным обеспечением 
Висош, например размером в 2 Гбайт, то при попытке проверки транзакций, кото- 
рые выводят средства из транзакций, расположенных в более ранних блоках, ваше- 
му узлу придется запрашивать копии более ранних блоков у других равноправных 
узлов. Каждый раз, когда программа получает данные от (недоверенного) равно- 
правного узла сети, она выполняет проверку хеша и цифровой подписи с целью 
убедиться, что все элементы в передаваемых данных действительны и заслуживают 
доверия. | 


Полный узел также может выступать в качестве клиентского узла. Клиентский 
узел позволяет пользователю системы ВИсош инициировать биткоин-транзакции с 
другими пользователями и отвечать на транзакции, инициированные другими поль- 
зователями. Большинство пользователей ВИсот используют клиентский узел, ко- 
торый может представлять собой приложение, запущенное на смартфоне. 


Далее мы более подробно рассмотрим требования к обработке при майнинге бит- 
коинов и узнаем, как цена на электроэнергию влияет на получаемую майнером 
прибыль. 


Процесс майнинга биткоинов 


Вычислительная сложность алгоритма 5НА-256 напрямую связана с возможностью 
извлечения прибыли из майнинга биткоинов. Единственный способ определить 
хеш-значение 5НА-256 для конкретного блока данных — это выполнить все этапы 
алгоритма ЗНА-256 над всеми битами в блоке. 


Ключевая особенность процесса майнинга биткоинов заключается в том, что про- 
цесс нахождения действительного одноразового кода, который позволит получить 
хеш-значение блока, не превышающее текущего целевого хеш-значения сети, на- 
меренно сделан очень сложным. В действительности, скорее всего потребуется ог- 
ромное количество предположений о различных значениях одноразового кода, 
прежде чем будет найден код, удовлетворяющий цели. Поскольку какая-либо пред- 
сказуемая взаимосвязь между содержимым блока и хешем ЗНА-256 для этого блока 
отсутствует, нет более эффективного метода определить подходящее значение од- 
норазового кода, чем простое многократное вычисление хеша для блока данных с 
помощью разных значений одноразового кода, пока не появится хеш, удовлетво- 
ряющий целевым критериям. 


Процесс поиска одноразового кода, удовлетворяющего требованию по целевому 
хешу, называют доказательством работы. Для того чтобы получить доказательст- 
во работы, необходимое для майнинга биткоинов, майнер должен использовать 
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подходящее оборудование и электроэнергию, а также потратить определенное вре- 
мя для выполнения алгоритма. 


Для современного ПК несложно перепробовать все возможные значения 32-раз- 
рядного одноразового кода в течение нескольких секунд. К сожалению для майне- 
ров, это вычисление редко позволяет получить хеш-значение, удовлетворяющее 
целевому значению хеша сети. После исчерпания всех возможных 32-разрядных 
значений одноразового кода майнер должен изменить пробный блок, с которым он 
работает. Затем он сможет начать перебор всех возможных значений одноразового 
кода для содержимого нового блока. Существует несколько приемлемых для сети 
Висот способов, с помощью которых майнеры могут изменить содержимое проб- 
ного блока. 


» Изменение метки времени внутри блока. Каждый блок в цепочке содержит 
метку времени, которая отражает время его создания, но сама метка не ис- 
пользуется для каких-либо важных целей, таких как определение порядка, 
в котором были созданы блоки. Если майнер безуспешно исчерпывает все 
возможные значения одноразового кода, можно изменить метку времени в 
заголовке блока и снова попробовать все возможные значения одноразового 
кода. Изменение метки времени, по сути, увеличивает размер пространства 
для поиска одноразового кода. Возможны лишь небольшие изменения метки 
времени, но значительные изменения недопустимы. 


» Добавление в блок новых транзакций. Вполне вероятно, что во время пре- 
дыдущего неудачного раунда поиска удовлетворительного одноразового кода 
из сети Висош продолжали поступать транзакции. Запросив новый пробный 
блок, содержащий недавно добавленные транзакции, майнер также увеличи- 
вает размер пространства для поиска одноразового кода. 


» Изменение данных в заголовке транзакции. Первая транзакция в списке 
транзакций блока является особенной в том смысле, что она представляет со- 
‘бой платеж майнеру за добавление блока в блокчейн. Майнер может доба- 
вить дополнительные данные к этой транзакции. Эти добавленные данные, 
при их использовании с целью увеличения пространства поиска одноразового 
кода, называют ехнаМопсе. Обычная процедура работы с ехиаМопсе заклю- 
чается в проверке хешей блоков для всех возможных значений одноразового 
кода, после чего, рассматривая ехаМопсе как целое число, следует увели- 
чить ехфаМопсе на единицу и повторить перебор всех возможных значений 
одноразового кода. 


Процедуры пошагового увеличения одноразового кода и выполнения других мани- 
пуляций для увеличения эффективного пространства поиска подходящего однора- 
зового кода, как правило, не занимают значительного времени в процессе майнинга 
биткоинов. Основная часть работы, связанной с процессом поиска, происходит во 
время многократного выполнения хеш-алгоритма ЭЗНА-256 при проверках различ- 
ных значений одноразового кода с целью найти хеш блока, который не превышает 
значения целевого хеша сети. 
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На заре майнинга биткоинов (примерно в 2010 г.) майнер мог использовать персо- 
нальный компьютер с достаточно хорошей производительностью, чтобы зарабаты- 
вать на майнинге несколько долларов в день. В то время уровень сложности, опре- 
деляемый целевым хешем сети, был достаточно низким, чтобы аппаратные 
средства стандартного ПК могли находить значения одноразового кода, удовлетво- 
ряющие цели хеша, с разумной вероятностью успеха. 


По мере присоединения к сети все большего количества майнеров и повышения 
производительности их вычислительного оборудования общий объем вычисли- 
тельной мощности, используемой для получения доказательств работы по добавле- 
нию каждого блока в цепочку, продолжал расти. 


Алгоритм корректировки целевого хеша сети ВИсош изменяет его значение после 
каждых 2016 блоков, чтобы поддерживать добавление одного блока в среднем каж- 
дые 10 минут. Это означает, что по мере роста общей вычислительной мощности 
сети Вйсош шансы любого майнера-одиночки, даже использующего очень мощный 
графический процессор, первым найти решение для любого блока значительно 
уменыпнаются. Майнер, скорее всего, вообще не получит никакой отдачи, даже по- 
сле многолетнего майнинга. 


Для того чтобы отдельные лица могли продолжать участвовать в майнинге биткои- 
нов с получением хотя бы некоторой отдачи от вложенных усилий, возникла кон- 
цепция пулов майнинга биткоинов. Это тема следующего раздела. 


Пулы майнинга биткоинов 


Пул майнинга биткоинов — это группа майнеров, которые объединяют свои вы- 
числительные мощности, чтобы увеличить шансы на вознаграждение после успеш- 
ного получения доказательства работы для блоков, добавленных в блокчейн 
Висот. Присоединяясь к майнинговому пулу, майнер соглашается вкладывать свои 
вычислительные мощности в пул и получать долю вознаграждений от майнинга, 
выполняемого участниками пула. 


По сути, участники майнингового пула разделяют большую задачу получения до- 
казательства работы на набор более мелких задач и передают эти задачи отдельным 
участникам пула для выполнения. Если один из участников пула правильно решает 
задачу получения доказательства работы, пул добавляет блок в цепочку и делит 
вознаграждение между участниками. 


Организаторы майнингового пула должны создать центр обработки данных для 
управления взаимодействием пула с его участниками-майнерами и с сетью ВиИсош. 
Для этого требуется вычислительное оборудование и персонал для его настройки и 
управления системой на повседневной основе. За эту услугу операторы майнинго- 
вых пулов взимают плату в размере обычно 1-3% прибыли от майнинга. 


Присоединение к пулу майнинга биткоинов позволяет майнеру получать некоторую 
(обычно небольшую) регулярную прибыль в обмен на предоставление вычислитель- 
ной мощности пулу. Чем больше вычислительной мощности (с точки зрения количе- 
ства хешей ЗНА-256, вычисляемых за единицу времени) вносит майнер, тем больше 
будет его вознаграждение, когда данный пул успешно добавит блок в цепочку. 
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Вероятность успеха конкретного пула майнинга биткоинов в течение определенно- 
го периода можно количественно оценить по скорости вычисления хешей для дан- 
ного пула относительно аналогичной скорости для всей сети Висош. Скорость 
вычисления хешей — это количество хешей ЗНА-256, рассчитываемых в секунду, 
где каждая операция хеширования является попыткой получить доказательство ра- 
боты для блока. 


В течение 2021г. общая скорость вычисления хешей в сети Висош по разным 
оценкам колебалась между 80 и 180 млн терахешей в секунду (Тх/с). Один тера- 
хеш — это один триллион хешей или 10'? хешей. Для обозначения одного миллио- 
на терахешей используется термин "эксахеш" (Эх), равный 10'* хешей. Эта едини- 
ца несколько упрощает обсуждение скорости расчета хешей в 202] г., которая 
менялась в промежутке от 80 до 180 эксахешей в секунду. Этот диапазон также 
можно выразить как 80—180 Эх/с. 


Доля общей скорости вычисления хешей сети, контролируемая пулом майнинга, 
определяет ожидаемую частоту добавления блоков для данного пула. Как мы виде- 
ли, майнинг нового блока занимает в среднем 10 минут. Следующее уравнение по- 
казывает, как часто майнинговый пул может рассчитывать на успех при майнинге 
блока, исходя из его доли в общей скорости хеширования сети: 


_ 10 минут 
Е 
Ны 


Т, (15.1) 


В уравнении (15.1) Тв представляет среднее время между блоками, добытыми пу- 
лом (в минутах), Нр — скорость вычисления хешей для пула, Ну — общую ско- 
рость вычисления хешей для сети. 


Это уравнение справедливо, т. к. процесс получения доказательства работы над бло- 
ком является статистическим по своей природе, где каждый обрабатывающий эле- 
мент сети выдвигает серию предположений, и каждое предположение, сделанное ка- 
ждым участником, имеет одинаковые, очень маленькие, но равные шансы на успех. 


Если пул контролирует 0,1% (или одну тысячную) общей скорости вычисления хе- 
шей сети, то согласно этой формуле он будет добывать новый блок в среднем каж- 
дые 10 000 минут, т.е. примерно раз в неделю. При текущей цене биткоина в 
45 000 долларов и вознаграждении за блок в размере 6,25 биткоина итоговое возна- 
граждение за блок составит 281 250 долларов плюс любые комиссии за транзакции, 
предлагаемые пользователями сети Висош. 


КОМИССИЯ ЗА ТРАНЗАКЦИИ 


Комиссия за транзакции — это добровольные платежи, предлагаемые 
2.4 пользователями сети Вйсош в качестве стимула для повышения уровня 
\\ => приоритета своих транзакций при их размещении в блоках во время 
майнинга. Каждый раз, когда пользователь инициирует новую биткоин- 
транзакцию, у него есть возможность выделить часть задействованных 
в транзакции средств в счет комиссии за эту транзакцию. 
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Майнеры могут выбирать, какие транзакции они включают в каждый 
блок, над которым работают. Это означает, что они обычно предпочи- 
тают транзакции, за которые предлагается более высокая комиссия. 
В периоды высокой частоты транзакций предложение низкой комиссии 
за транзакцию может привести к более длительному ожиданию ее до- 
бавления в блокчейн. 


В конце концов, когда количество монет, оставшихся для добычи, при- 
близится к нулю, плата за транзакции станет единственным стимулом 
для майнеров продолжать обрабатывать транзакции и добавлять блоки 
в цепочку. В течение 2021 г. еженедельная медианная (медиана — чис- 
ло из набора, половина значений в котором меньше, а другая половина 
значений — больше этого числа) комиссия за биткоин-транзакцию ме- 
нялась от 0,27 до 26,96 доллара. 


Носле успешного добавления нового блока в цепочку менеджер майнингового пула 
должен разделить вознаграждение за этот блок между участниками пула. Для того 
чтобы отслеживать долю доказательства работы, приходящуюся на каждого майне- 
ра в пуле, программа управления пулом устанавливает для своих майнеров целевое 
значение хеша, которое значительно выше (условие, которое легче выполнить) це- 
левого хеша сети. Это означает, что участники пула будут возвращать менеджеру 
пула множество хеш-решений, которые удовлетворяют целевому уровню пула, но 
не удовлетворяют целевому уровню сети. Отслеживая, сколько хешей, удовлетво- 
ряющих цели пула, возвращает каждый майнер, менеджер пула может определить, 
сколько хешей было вычислено каждым участником пула. После этого вознаграж- 
дение за блок распределяется между участниками пула пропорционально их вкладу 
в общую работу по расчету хеш-значений. 


При типичной для 2021 г. скорости вычисления хешей сети в 140 Эх/с пул должен 
работать со скоростью 140 000 терахешей в секунду, или 140 000 Тх/с, чтобы кон- 
тролировать 0,1% скорости вычисления хешей сети. Это определенно выглядит как 
достаточно большое количество хешей. Для того чтобы получить некоторое пред- 
ставление о вычислительной мощности, необходимой для достижения такой скоро- 
сти вычисления хешей, давайте для начала обсудим использование процессоров 
стандартных ПК для выполнения операции хеширования. Мы рассмотрим этот во- 
прос с точки зрения одиночного майнера, который не участвует в майнинговом пуле. 


Майнинг с помощью центрального процессора 


Если вы не хотите платить комиссию, требуемую от участников пула майнинга 
биткоинов, вы можете заняться майнингом самостоятельно, используя одно или 
несколько вычислительных устройств, находящихся в вашей собственности или 
под вашим контролем. Такой подход называют соло-майнингом. Мы можем оце- 
нить доходы от соло-майнинга на основании возможностей хеширования оборудо- 
вания, выделенного для этой цели. 
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Одним из самых производительных процессоров, доступных в настоящее время, 
является АМО Вугеп ТЬгеадпррег 3970Х. Он имеет 32 ядра и поддерживает 64 од- 
новременных потока с тактовой частотой, которая колеблется от 3,7 до 4,5 ГГц. 
Большое количество одновременных потоков позволяет параллельно вычислять 
хеши для нескольких значений одноразового кода. Если судить по сравнительным 
тестам, процессор 3970Х. может вычислять около 19 900 биткоин-хешей в секунду. 


Рассмотрим ПК, содержащий один процессор АМО Вугеп Тргеадпррег 3970Х. Мы 
можем подставить скорость вычисления хешей этого процессора в уравнение (15.1) 
и оценить интервал между успешной добычей блоков. Предположим, что номи- 
нальная сетевая скорость вычисления хешей для 2021 г. составляет 140 Эх/с. Ре- 
зультат этого вычисления показан в уравнении (15.2). 


10 минут :6 
ТЕ =7,04х10'° минут. 15.2 
8 [19,8х10? НУ (15-2) 


140х10'8 


Из этого уравнения мы видим, что средний интервал между успешно добытыми 
блоками на одном 3970Х равен 7,04 х 10'° минут, что составляет около 133 млрд 
лет. Очевидно, что эта конфигурация не является жизнеспособной для тех, кто пы- 
тается получить хоть какую-то отдачу от майнинга биткоинов. 


Вскоре после первого представления концепции биткоина была выпущена версия 
программы для майнинга с открытым исходным кодом, которая использовала воз- 
можности параллельной обработки аппаратных средств графических процессоров 
(СРО). Мы рассмотрим этот вопрос в следующем разделе. 


Майнинг с помощью графического процессора 


Основным вычислением для майнинга биткоинов является хеш-алгоритм ЗНА-256. 


Задача проверки очень большого количества значений одноразового кода идеально 
подходит для архитектуры компьютера с параллельной обработкой, поскольку ка- 
ждая такая проверка не зависит от всех остальных. Из-за этого присущего данному 
процессу параллелизма переход в контекст СОРИ был естественным шагом для про- 
граммного обеспечения майнинга биткоинов. При запуске на графическом процес- 
соре код майнинга в полной мере использует большое количество элементов обра- 
ботки для выполнения алгоритма хеширования с гораздо более высокой скоростью, 
чем может достичь центральный процессор даже с большим количеством ядер. 


Высокопроизводительный графический процессор способен достичь гораздо более 
высокой скорости при работе с алгоритмом ЗНА-256, чем микропроцессор. В пер- 
вые годы. существования биткоина многие майнеры использовали высокопроизво- 
дительные графические процессоры для майнинга биткоинов. Примерно до 2014 г. 
майнеры могли с выгодой использовать растущую вычислительную мощность гра- 
фических процессоров для выполнения вычислений со скоростью около 1 гигахеша 
в секунду, или 1 Гх/с, что равно 10? хешей в секунду. 
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Если мы подставим это значение скорости в уравнение (15.1), то сможем найти 
средний интервал успешного добавления блоков для 2021 г.: 


То ОМИНУГ 140х107 минут. (15.3) 
110 


140х10'° 


Результатом этого вычисления является среднее значение 1,40 х 10'2 минут, что со- 
ставляет более 2,6 млн лет. Этот временной интервал успешного добавления бло- 
ков намного лучше, чем при использовании лишь одного мощного центрального 
процессора, но это все равно совсем не то, что любой вменяемый майнер-одиночка 
попытался бы сделать в 2021 г. 


Использование графических процессоров для майнинга биткоинов стало невыгод- 
ным, когда на рынок были выведены устройства на основе специализированных 
интегральных схем (АЗ[С), единственной целью которых являлся майнинг с гораз- 
до более высокой скоростью вычисления хешей, чем могли предложить процессо- 
ры общего назначения или графические процессоры. Вычислительные системы, 
в которых используются специализированные интегральные схемы, являются пред- 
метом следующего раздела. 


Компьютерные архитектуры 
для майнинга биткоинов 


Алгоритм ЗНА-256 представляет собой четко определенную последовательность 
многократно повторяющихся простых логических операций с 32-разрядными эле- 
ментами данных. Этот алгоритм не требует большого объема памяти при работе с 
блоками небольшого размера (заголовки биткоин-блоков всегда имеют длину 80 байт). 
Задачи такого типа являются идеальными кандидатами для оптимизации произво- 
дительности с использованием цифровых аппаратных средств, специально предна- 
значенных для этой области применения. 


Входными данными для этого алгоритма майнинга является заголовок блока- 
кандидата, содержащий перечисленные ниже элементы данных. 


› Номер версии ВИсош (4 байта) — это поле определяет версию программно- 
го обеспечения Висот Соге. Майнер выбирает номер версии, совместимой с 
программным обеспечением для майнинга биткоинов. 


» Хеш предыдущего блока (32 байта) — хеш-значение предыдущего блока в 
блокчейне. Это значение извлекается из сети Висош как хеш текущего по- 
следнего блока в блокчейне. 


е Корень дерева Меркла (32 байта) — это хеш-значение защищает все тран- 
закции в блоке-кандидате. Термин "корень дерева Меркла" относится к дре- 
вовидной структуре данных, которая начинается с хешей отдельных биткоин- 
транзакций и объединяет эти хеши таким образом, чтобы обеспечить эффек- 
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тивную и безопасную проверку целостности каждой отдельной транзакции в 
дереве. 


» Время (4 байта) — метка времени блока в секундах, прошедших с 1 января 
1970 г. по всемирному координированному времени (Соогдта{еа Отуегза] 
Тите, ОТС). Допустимая метка времени блока должна находиться в пределах 
трехчасового окна относительно текущего времени, определяемого сетью 
Висош. Это окно допустимости позволяет некоторую корректировку времени 
блока для увеличения пространства поиска хеша. Ввиду такой гибкости нель- 
зя считать, что метки времени блоков в блокчейне отражают точное время 
создания блока. 


е Биты (4 байта) — это поле определяет сложность целевого хеша сети. Здесь 
размещается значение с плавающей запятой, представленное 24-битной ман- 
тиссой и 8-битным порядком в уникальном формате, принятом в сети Висо. 
Это значение предоставляется сетью Висо!ш. 


е Однократный код (4 байта) — поле, значение которого майнер изменяет, 
пытаясь сгенерировать различные хеши. 


Эти поля объединяются, формируя 80-байтовый заголовок блока-кандидата. После 
установки допустимых значений для всех шести параметров майнер вычисляет хеш 
заголовка и сравнивает его с целевым хешем сети. Если вычисленное значение хе- 
ша равно или меньше целевого значения хеша сети, определенного в поле 511$ (би- 
ты) заголовка, блок считается действительным, и майнер может отправить его в 
сеть для проверки и добавления в блокчейн. 


ДВОЙНОЙ АЛГОРИТМ $НА-256 


Алгоритм хеширования биткоин-блока фактически дважды выполняет 
ЗНА-256 для вычисления хеша заголовка блока. Сначала он вычисляет 

и хеш заголовка 80-байтового блока, а затем вычисляет хеш для хеша, 
вычисленного на первом шаге. 


Это вычисление может быть выражено в виде 
ЗНА-256(5НА-256(заголовок)). 


Почти любое предположение о значении одноразового кода дает хеш, не отвечаю- 
щий условию для действительного блока. Майнер систематически изменяет одно- 
разовый код и, возможно, метку времени (в допустимых пределах), а также другие 
части блока, пытаясь вычислить хеш, который обеспечит получение действитель- 
ного блока. Большая часть работы в этом процессе приходится на повторение опе- 
раций алгоритма 5НА-256. 


Первым шагом в разработке специализированных аппаратных средств для майнин- 
га биткоинов является использование в этих целях программируемой логической 
интегральной схемы (ПЛИС — Не!9-ргозтатта Ме рае атау, ЕРСА). Это тема 
следующего раздела. 
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Майнинг с помощью ПЛИС 


ПЛИС, описанные в главе 2, предоставляют средства для создания аппаратной схе- 
мы, оптимизированной для решения конкретной задачи, путем подключения к схе- 
ме набора универсальных цифровых компонентов, таких как логические вентили, 
триггеры и регистры. Используя язык описания аппаратных средств (НОГ), разра- 
ботчик может определить логическую последовательность выполнения алгоритма 
ЗНА-256, а компилятор НОГ, превратит эту спецификацию в схему, которую можно 
загрузить в ПЛИС. 


Для того чтобы это решение было полезным для майнинга биткоинов, необходимо 
включить в его архитектуру некоторую дополнительную логику для управления 
вводом данных, подлежащих хешированию, и последующего извлечения выходных 
данных из алгоритма хеширования. 


В простейшей реализации этого решения программное обеспечение для майнинга 
может предоставлять алгоритму ПЛИС входные данные, состоящие из заголовка 
блока-кандидата и текущего пробного значения одноразового кода. После получе- 
ния входных данных ПЛИС выполняет алгоритм хеширования ЗНА-256 и возвра- 
щает полученное хеш-значение в программное обеспечение майнинга в качестве 
выходных данных. 


На рис. 15.2 показана возможная реализация этого простого подхода к майнингу. 


2. Заголовок- 
кандидат 


1. Блок-кандидат 


Сеть Хост ПЛИС 
Висот майнинга майнинга 


4. Допустимый 
заголовок 


3. Хеш заголовка 


Рис. 15.2. Простая реализация майнинга на основе ПЛИС 


Последовательность операций для такой конфигурации майнинга состоит из сле- 
дующих этапов: 


1. Хост майнинга (это может быть стандартный ПК или серверная система) за- 
прашивает и получает из сети Вйсош блок-кандидат для работы. 


2. Хост майнинга передает заголовок блока-кандидата (включая текущее пробное 
значение одноразового кода) в ПЛИС майнинга для хеширования. 
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3. ПЛИС выполняет операцию хеширования и возвращает хеш-значение хосту 
майнинга. 


4. Хост майнинга оценивает хеш. Если он удовлетворяет требованиям сети, хост 
пересылает блок в сеть Висош для включения в блокчейн. 


Этот подход предусматривает выполнение всех необходимых для майнинга бит- 
коинов этапов с использованием высокоскоростной ПЛИС, однако описанная здесь 
конфигурация вряд ли обеспечит достаточную скорость хеширования, способную 
заинтересовать любого серьезного майнера. Это связано с тем, что затраты ресур- 
сов, необходимые для передачи данных в ПЛИС и из нее для каждой оценки хеша, 
скорее всего, резко снизят среднюю скорость хеширования. 


В улучшенной конфигурации с использованием ПЛИС можно было бы предусмот- 
реть циклическое выполнение операции хеширования над целым диапазоном зна- 
чений одноразового кода и прерывать этот цикл только при безуспешном заверше- 
нии проверки для всего диапазона или нахождении удовлетворительного хеш- 
значения. Диапазон проверяемых значений одноразового кода может быть закоди- 
рован во встроенном программном обеспечении ПЛИС, и этот диапазон можно 
расширить до всех 23? возможных значений одноразового кода. Такая конфигура- 
ция похожа на конфигурацию, показанную на рис. 15.2, и при ее использовании 
ПЛИС могла бы в перспективе достичь скорости хеширования, очень близкой к 
максимально достижимой. 


С использованием подхода, подобного описанному здесь, были разработаны раз- 
личные варианты ПЛИС для вычисления хешей при майнинге биткоинов. Макси- 
мальная скорость хеширования сильно зависит от возможностей чипа ПЛИС, ис- 
пользуемого для выполнения алгоритма. С помощью реализаций ЗНА-256 на 
основе ПЛИС была достигнута скорость хеширования до нескольких сотен (Мх/с). 
ПЛИС, вычисляющая хеши со скоростью 500 Мх/с, может протестировать все 
23? значения одноразового кода менее чем за 10 секунд. 


В 2014 г. скорость хеширования на одном чипе ПЛИС в несколько сотен миллио- 
нов хешей в секунду не казалась слишком впечатляющей по сравнению с графиче- 
скими процессорами, которые могли вычислять хеши со скоростью до 1 Гх/с. Од- 
нако существуют и другие факторы, влияющие на экономику майнинга биткоинов. 
Стандартная ПЛИС может стоить несколько долларов по сравнению с ценой высо- 
копроизводительного графического процессора в несколько сотен долларов. Кроме 
того, ПЛИС обычно потребляет лишь малую часть от мощности, потребляемой 
графическим процессором. Как мы увидим позже, энергопотребление системы 
майнинга является ключевым фактором, помогающим определить, зарабатывает 
майнер биткоинов деньги или теряет их. 


Идея создания компьютера с несколькими ПЛИС для майнинга биткоинов может 
показаться выигрышным подходом по сравнению с майнингом с помощью цен- 
трального или графического процессора, однако использование специализированных 
интегральных схем (АЗГС) вместо ПЛИС дает еще более высокую производитель- 
ность и может обойтись дешевле, если эти устройства можно продать в достаточном 
количестве. Майнинг с помощью АЗС — это тема следующего раздела. 
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Майнинг с помощью А$1С 


Специализированная интегральная схема (аррИсаНоп-зресйс пиертае сисий, 
А$1С) — это специально разработанный чип, который реализует определенную 
функцию или набор функций. Ниже перечислены основные отличительные осо- 
бенности АЗС по сравнению с процессорами общего назначения, графическими 
процессорами и ПЛИС. 


е АЗС содержит только те схемы, которые необходимы для выполнения ее 
предполагаемой функции. На кристалле нет никаких дополнительных схем, 
занимающих место и потребляющих электроэнергию. Благодаря этому от- 
дельный кристалл АЗС меньше по размеру и потребляет меньше энергии, 
чем ПЛИС общего назначения. Это делает АЗС менее дорогостоящими в 
производстве и менее затратными в эксплуатации, если они изготавливаются 
в достаточно большом количестве. 


» Изготовление первой копии АЗС обходится очень дорого. Для создания 
схемы и изготовления первой партии кристаллов требуется огромный объем 
работы по проектированию самой схемы и производственной линии. Если 
после начала производства в конструкции обнаруживается серьезная ошиб- 
ка, пересмотр конструкции для устранения проблемы также обходится 
очень дорого. 


е После того как производственная линия настроена и проверки показали, что 
изготовленные схемы работают должным образом, производство чипа в 
больших объемах становится очень недорогим с точки зрения затрат на чип. 


По мере роста интереса со стороны майнеров и инвесторов в годы, последовавшие 
за появлением биткоина, экономика оборудования для майнинга росла, обеспечи- 
вая такой уровень спроса, который оправдывал затраты и усилия на производство 
АЗС для майнинга. 


Компания Витат (в рз://ууууу.Бтат.сот/) является крупнейшим изготовителем 
оборудования для майнинга биткоинов, которое включает в себя чипы АЗС для 
майнинга, а также комплектные компьютерные системы для майнинга на основе 
этих чипов. Помимо разработки оборудования для майнинга В!таш занимается 
майнингом в собственных интересах и управляет как минимум двумя майнинговыми 
пулами: ВТС.сот (В@рз://роо1.6с.соп/) и Ап{Роо| (В рз://У3З.апроо!.сот/Воте). 


Компания Виташ разработала несколько АЗС для майнинга биткоинов, начиная с 
чипа ВМ1380, который был выпущен в ноябре 2011 г. Этот чип может выполнять 
вычисления со скоростью до 2,8 Гх/с при максимальном рабочем напряжении 1,10 В. 


В!таш также выпустила майнинговый компьютер Апипшег $51, который содержал 
64 чипа ВМ1380. Эта система могла работать со скоростью 180 Гх/с при потребле- 
нии 360 Вт электроэнергии. 


Такая скорость хеширования намного превышает ту, которой можно было бы дос- 
тичь даже с помощью нескольких графических процессоров или 64 чипов ПЛИС. 
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Давайте оценим, сколько времени в среднем проходит между успешными добавле- 
ниями блоков при использовании Апипшег 51. 


10 минут 9 
ТГ == =7,78х10° минут. 15.4 
10х10 нут (15.4) 


140х108 


Среднее время между успешными добавлениями блоков для Апипшег $1 составля- 
ет 7,78 х 10? минут, т.е. около 14 800 лет. Это намного лучше, чем для быстрого 
графического процессора, но все же не является приемлемой конфигурацией для 
майнера-одиночки, работающего в 2021] г. 


Следом за ВМ1380 компания Виташ выпустила серию модернизированных АЗС 
для майнинга: ВМ1382 (апрель 2014 г.), ВМ1384 (сентябрь 2014 г.), ВМ1385 (ав- 
густ 2015 г.) и ВМ1387 (май 2017 г.). Для версий АЗС, которые последовали за 
указанными выше, Витат опубликовала меньше подробностей. Общая тенденция 
в каждой новой итерации АЗС заключалась в увеличении скорости хеширования и 
снижении энергопотребления в расчете на вычисленное хеш-значение. 


В 2021 г. одним из самых быстрых доступных майнеров Вшташ стала система 
Апнитег 519 Рго со скоростью хеширования 110 Тх/с. Она потребляет 3250 Вт и 
продается примерно за 15 000 долларов. Эта система вмещает три платы хеширова- 
ния, каждая из которых содержит 114 чипов ВМ1398. 


Все 114 чипов на каждой плате соединены последовательно — такую конфигура- 
цию называют последовательной. 319 Рго имеет плату управления, содержащую 
процессор и встроенное ПО, которое взаимодействует с каждой из хеш-плат и хеш- 
чипов на ней и управляет их работой. Протокол для связи с чипами представляет 
собой последовательный формат данных, аналогичный тому, который используется 
стандартными последовательными портами на компьютерах и других цифровых 
устройствах. 


Плата управления отправляет команды через последовательный интерфейс на пер- 
вый чип АЗС ВМ1398 в последовательной цепочке, тот передает ту же команду на 
следующий чип ВМ1398 в цепочке и т. д. 


Каждый чип ВМ1398 имеет набор аппаратных адресных строк, которые уникаль- 
ным образом идентифицируют его в последовательной цепочке. Чип АЗС исполь- 
зует эти адресные строки для определения выделенной ему части пространства по- 
иска одноразового кода. 


Каждый чип ВМ1398 может размещать на шине сообщения, которые проходят по 
последовательной цепи и принимаются платой управления. Основным типом со- 
общения, генерируемого чипом хеширования, является уведомление о том, что 
данный чип получил одноразовый код, который удовлетворяет целевому требова- 
нию хеширования. 


На рис. 15.3 показана общая конфигурация компонентов в Апиппег 519 Рго. 
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Аптттег $19 Рго 


АЗС ВМ1398 (114 шт. на плате) 


Источник 
питания 


Сеть 
Висот 


Последовательная 
связь 


Вентиляторы 


(4) 


Платы хеширования (3) 


Рис. 15.3. Конфигурация аппаратных средств Апётгтег $19 Рго 


При скорости хеширования 110 Тх/с уравнение (15.5) дает следующий средний ин- 
тервал решения успешного добавления блока для Апиптег $19 Рго: 


р о МИНУЕ с не (15.5) 
В 


110х107 
140х10'8 


Со средним интервалом успешного добавления блока в 1,27 х 10’ минут ожидается, 
что при типичной для 2021] г. скорости хеширования Апьпшег 519 Рго сможет 
успешно добавлять блок в блокчейн каждые 24,2 года. И в этом случае данная кон- 
фигурация не слишком хорошо подходит для майнера-одиночки, и именно по этой 
причине все серьезные майнеры, располагающие небольшими ресурсами, присое- 
диняются к майнинговым пулам, чтобы получать надежный, хотя и небольшой, доход. 


Но что, если вы не занимаетесь мелким бизнесом, а вместо этого располагаете средст- 
вами для работы в промышленных масштабах? Допустим, вы покупаете 1000 ма- 
шин Арыпшег $19 Рго и устанавливаете их в специальном помещении для компью- 
теров с соответствующим питанием, кондиционированием воздуха, контролем 
влажности и фильтрацией воздуха. Такой комплекс обеспечит средний интервал 
добавления блока, показанный в уравнении (15.6). 

10 минуг 


И =1,27х10* минут. 15.6 
8 [1000х110х107 ыы т 


140х108 


Эта рабочая конфигурация сокращает средний интервал добавления блока до 
1,27 х 10* минут, что составляет около 8,8 суток. Такая конфигурация уже выглядит 
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более приемлемой для майнера, заинтересованного в получении более-менее регу- 
лярной отдачи от инвестиций в систему майнинга. 


И что это за инвестиции — 15 млн долларов только за 1000 систем Апитшег 519 
Рго (если не учитывать возможную скидку на количество)! В следующем разделе 
будет рассмотрена экономика майнинга биткоинов с точки зрения первоначальных 
инвестиций, текущих расходов и ожидаемой доходности. 


Экономика майнинга биткоинов 


Помимо подключения к сети успешный майнинг биткоинов в промышленных мас- 
штабах требует четырех основных компонентов: 


е подходящее помещение; » электроэнергия; 
» оборудование для майнинга; » время. | 


Наше обсуждение до этого момента было сосредоточено на требованиях к обработ- 
ке для решения задачи вычисления хеш-значений, необходимой для проверки бит- 
коин-блока с целью его добавления в блокчейн. По мере того как оборудование для 
майнинга биткоинов становилось все более специализированным и мощным, общее 
количество потребляемой для майнинга электроэнергии неуклонно росло. Согласно 
анализу, проведенному Кембриджским университетом в феврале 2021 г., на май- 
нинг биткоинов во всем мире расходуется в среднем больше электроэнергии, чем 
потребляет Аргентина. 


Система Апнпшег $19 Рго, рассмотренная в предыдущем разделе, потребляет 
3250 Вт ‚, что эквивалентно 78 кВт-ч/сутки. В зависимости от цены на электроэнер- 
гию в регионе, где осуществляется майнинг, расходы на нее могут свести на нет 
большую часть или даже всю прибыль, которую можно было бы получить от 
успешного решения задачи вычисления хешей для блоков. 


Тенденция в оборудовании для майнинга биткоинов заключалась в увеличении 
мощности хеширования каждого нового поколения систем майнинга при одновре- 
менном сокращении количества электроэнергии, необходимой для вычисления ка- 
ждого хеша. 


Это привело к разработке спецификаций для систем майнинга, которые количест- 
венно определяют мощность, потребляемую на операцию хеширования. Один джо- 
уль (Дж) равен одному ватту мощности за период в одну секунду. Другими слова- 
ми, | Вт=1 Дж/с. Для определения коэффициента полезного действия системы 
Апбтирег $19 Рго следует поделить 3250 Дж/с на 110 Тх/с, что в итоге дает 
29,5 Дж/Тх. Апнишег 519 Рго, помимо обеспечения очень высокой скорости хеши- 
рования в 110 Тх/с, является одной из самых энергоэффективных систем майнинга 
биткоинов, доступных на рынке. 


Несмотря на тенденцию к повышению эффективности хеширования, общее энерго- 
потребление сети Висош продолжает расти. Огромное потребление электроэнергии 
сетью рассматривается некоторыми как расточительство и как вклад в экологиче- 
ские и климатические проблемы. 


Помимо желания уменьшить негативное влияние высокого энерг опотребления при 
майнинге биткоинов, мелкие майнеры были недовольны тем, что их лишили воз- 
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можности добывать биткоины с разумной прибылью крупные предприятия про- 
мышленного майнинга, расположенные в странах по всему миру. 


Биткоин далеко не единственная существующая в настоящее время криптовалюта. 
В 2021 г. в активно использовались более 10 000 различных криптовалют. Некото- 
рые из них достигли такого уровня популярности и общей рыночной стоимости, 
что смогли в определенной степени конкурировать с биткоином. Некоторые из этих 
валют имеют специфические особенности для борьбы с предполагаемыми негатив- 
ными тенденциями, характерными для биткоина. Мы обсудим некоторые из этих 
альтернативных криптовалют в следующем разделе. 


Альтернативные виды криптовалют 


Майнинг биткоинов начался как прибыльное развлечение для компьютерных энту- 
зиастов, которые использовали свободные вычислительные циклы на своих процес- 
сорах. Поскольку применение дорогих, шумных и энергозатратных систем майнинга 
выросло до промышленных масштабов, возможность получать даже минимальную 
прибыль с помощью самодельной системы майнинга биткоинов исчезла. 


Это одна из причин разработки многочисленных криптовалют в качестве альтерна- 
тивы биткоину, которые обычно называют альткоинами. Некоторые альткоины 
нацелены на то, чтобы усложнить и удорожить разработку АЗС для решения необ- 
ходимой для их майнинга задачи. Часть из них предназначена для того, чтобы из- 
бежать трудоемкого получения доказательства работы, которое составляет основу 
биткоина. Избегая намеренно интенсивных вычислительных операций, эти валюты 
существенно сокращают количество электроэнергии, необходимой для майнинга и 
совершения транзакций с ними. 


Для того чтобы любая криптовалюта получила широкое признание и применение, 
новые пользователи должны быть уверены, что любые средства, которые они дове- 
ряют валюте, сохранят свою ценность с течением времени, а негативные последст- 
вия, такие как обнаружение того, что чей-то цифровой кошелек был опустошен во- 
ром, маловероятны. Это жесткие стандарты, которым должна соответствовать 
новая криптовалюта. Тем не менее несколько альткоинов, основанных на техноло- 
гии блокчейна, достигли уровня широкого признания и применения. Далее описаны 
некоторые из основных альтернативных криптовалют на 2021 г. и их ключевые 
особенности. 


е Е !Негеит (Эфириум). Это децентрализованная программная платформа, по- 
добная платформе Висот. Она обеспечивает поддержку смарт-контрактов и 
распределенных приложений, которые можно использовать для выполнения 
таких функций, как перевод платежей от покупателя продавцу. Смарт- 
контракты — это хранящиеся в блокчейне Ефегеит программы, которые 
выполняются при удовлетворении предопределенных условий. Смарт- 
контракты предназначены для облегчения исполнения юридических согла- 
шений открытым и поддающимся проверке способом. Криптовалюта 
Ефегеит, используемая для оплаты вычислительных ресурсов и транзакций в 
сети Ефегеит, носит название Е\ег (эфир). Вместо дорогостоящей в отно- 
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шении вычислительных ресурсов концепции получения доказательства рабо- 
ты, реализованной в Висош, Еегеит использует процесс, называемый дока- 
зательством владения. Доказательство владения (ргооЁ оЁ $аКе) основано на 
количестве монет Еег, которыми владеет майнер, и владение ими позволяет 
майнеру проверять транзакции в сети. 


е ГИесош. Система Гиесош была запущена в 2011 г. как ответвление (форк) 
системы Висо и имеет с ней много общего. Гцесош была разработана с ак- 
центом на быстром одобрении транзакций даже при больших объемах тран- 
закций. Время добавления блока в Гцесош было сокращено до 150 секунд по 
сравнению с 10 минутами в Висот. Может быть создано до 84 млн лайткои- 
нов, что превышает общее количество биткоинов. 


е Ооресот. Криптовалюта Ооресош была создана в 2013 г., по-видимому, в ка- 
честве шутки, задуманной как заявление о продолжающихся спекуляциях с 
криптовалютами, такими как Висот. Логотипом Ооресош служит фотогра- 
фия собаки породы сиба-ину. В мае 2021г. рыночная капитализация 
Роресош составляла 85 млрд долларов. Доресот является форком базы кода 
Гиесош и отличается от многих других криптовалют тем, что не имеет фик- 
сированного ограничения на предложение валюты. Вместо этого в ней преду- 
смотрен стабильный "уровень инфляции" в 5 млн новых монет Ооресо!ш, соз- 
даваемых в год. Время добавления блока для Роресот составляет 60 секунд. 


» ВИисот СазВ — это форк Висот. Висош СазЬ была создана после возникно- 
вения разногласий между фракциями сторонников ВИсош относительно 
предлагаемого обновления, которое позволило бы увеличить размеры блоков 
для наборов транзакций. Больший размер блока позволяет включать больше 
транзакций в один блок блокчейна. Это означает возможное сокращение вре- 
мени ожидания выполнения транзакции. Комиссия за транзакции в ВИисот 
СазВ так же, как правило, ниже. Как и в случае с другими перечисленными 
здесь альтернативными криптовалютами, Висош СазВ использует отдельный 
от Вйсош блокчейн. 


Это лишь некоторые из наиболее известных альткоинов, используемых в настоящее 
время. Несмотря на тысячи существующих альтернативных криптовалют, Висот 
остается доминирующей криптовалютой с точки зрения широты использования и 
стоимости транзакций. В ноябре 2021 г. рыночная капитализация Вйсош составля- 
ла 1 трлн долларов. 


Резюме 


Эта глава началась с краткого введения в концепции, связанные с блокчейном, от- 
крытым криптографически защищенным реестром, содержащим последователь- 
ность финансовых транзакций. Обсуждение продолжилось обзором процесса май- 
нинга биткоинов, который добавляет транзакции в последовательность блокчейна и 
вознаграждает тех, кто выполняет эту задачу, оплатой в биткоинах. Для майнинга 
биткоинов требуется высокопроизводительное вычислительное оборудование, ко- 
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торое часто специально разрабатывают для решения этой задачи. Глава заверши- 
лась описанием особенностей этих аппаратных архитектур. 


Прочитав эту главу, вы получили представление о том, что такое блокчейн Висот 
и как используется эта технология. Вы ознакомились с этапами процесса майнинга 
биткоинов и с ключевыми особенностями компьютерных архитектур для майнинга 
биткоинов. 


В следующей главе будут рассмотрены возможности вычислительных архитектур 
для самоуправляемых автомобилей, включая типы датчиков и источники информа- 
ции, которые предоставляют таким автомобилям входные данные во время движе- 
ния, а также типы вычислений, необходимых для управления автомобилем в реаль- 
ных дорожных ситуациях. 


Упражнения 


1. Откройте веб-страницу для просмотра информации о транзакциях блокчейна по 
адресу В р5://5Мар$.сот и найдите список последних блоков. Щелкните на 
номере блока, откроется окно с заголовком блока в шестнадцатеричном форма- 
те и хешем 5НА-256. Скопируйте оба эти элемента и напишите программу, 
чтобы определить, является ли предоставленный хеш правильным хешем заго- 
ловка. Не забудьте дважды выполнить алгоритм ЗНА-256 для вычисления хеша 
заголовка. 


2. Настройте полный равноправный узел Висош и подключите его к сети Висош. 
Загрузите программное обеспечение Висот Соге по адресу В@рз://6сот.огр/ 
еп/до\ушоа@. Вам потребуется быстрое подключение к Интернету и не менее 
200 Гбайт свободного места на диске. 


16 


Архитектуры 
для самоуправляемых автомобилей 


В этой главе описываются возможности вычислительных архитектур для само- 
управляемых автомобилей. Глава начинается с обсуждения типов датчиков и ис- 
точников информации, которые предоставляют таким автомобилям входные дан- 
ные во время движения. Далее мы перейдем к обсуждению требований по 
обеспечению безопасности самоуправляемого автомобиля и его пассажиров, а так- 
же других транспортных средств, пешеходов и стационарных объектов. Затем бу- 
дет приведено описание типов вычислений, необходимых для эффективного управ- 
ления автомобилем. Глава завершится обзором примера архитектуры компьютера 
для самоуправляемого автомобиля. 


Эта глава поможет вам ознакомиться с основами вычислительной архитектуры для 
самоуправляемых автомобилей и с типами датчиков, используемых такими транс- 
портными средствами. Вы получите представление о типах вычислений, выпол- 
няемых самоуправляемыми автомобилями, Ио проблемах безопасности, связанных 
с такими транспортными средствами. 


В этой главе будут представлены следующие темы: 
» обзор самоуправляемых автомобилей; 
» аспекты безопасности самоуправляемых автомобилей; 


» требования к аппаратным средствам и программному обеспечению для само- 
управляемых автомобилей; 


е вычислительная архитектура автономного транспортного средства. 
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Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны по адресу 
В@рз://2ИВиБ.сот/РаскРиБ И Нт?/Модегп-Сотршег-Агсп{есиге-апд- 
ОграштаНоп-Зесопд-ЕЧюп. 


Обзор самоуправляемых автомобилей 


Несколько крупных производителей автомобилей и технологических компаний ак- 
тивно занимаются разработкой и продажей полностью самоуправляемых, или авто- 
номных, автомобилей. Утопическое представление о безопасных, полностью само- 
управляемых транспортных средствах манит нас в будущее, в котором пассажиры 
могут отдыхать, читать или даже спать в пути, а вероятность попасть в серьезное 
дорожно-транспортное происшествие будет намного ниже по сравнению с доста- 
точно опасной ситуацией в этой сфере в настоящее время. 


Эта картина будущего прекрасна, однако нынешнее положение дел в области само- 
управляемых автомобилей остается далеким от этой цели. Профильные эксперты 
прогнозируют, что потребуются десятилетия, чтобы полностью разработать и вне- 
дрить технологии, которые смогут обеспечить широкую поддержку и использова- 
ние полностью автономного транспорта. 


Для того чтобы разобраться в требованиях к системам автономного вождения, мы 
начнем с действий, которые выполняет водитель-человек для управления совре- 
менным автомобилем. 


е Выбор передачи. Для простоты мы предполагаем, что автомобиль оснащен 
автоматической коробкой передач, которая позволяет водителю выбирать 
режимы парковки, движения вперед и движения назад. 


е Выбор направления движения (руление). Это действие выполняется по- 
средством рулевого колеса. 


» Педаль газа. Нажатие этой педали ускоряет автомобиль в направлении, вы- 
бранном рукояткой переключения передач. 


» Педаль тормоза. Независимо от того, движется автомобиль вперед или на- 
зад, нажатие педали тормоза замедляет и в конечном счете останавливает его. 


Для достижения целей полностью автономного вождения технологии должны быть 
развиты до такой степени, чтобы управление всеми четырьмя этими действиями 
можно было доверить датчикам и вычислительным системам, которыми оснащено 
автоматизированное транспортное средство. 


Для того чтобы понять текущее состояние технологий самоуправляемых автомоби- 
лей относительно цели полностью автономного вождения, полезно обратиться к 
шкале, которая определяет этапы перехода от автомобилей с исключительно руч- 
ным управлением к полностью автономной архитектуре. Это тема следующего раз- 
дела. 


464 Глава 16 


Уровни автономности вождения 


Общество автомобильных инженеров (Зос1еу ог Аиютонуе Епршеегз, ЗАЕ) 
определило шесть уровней автоматизации управления автомобилем 
(см. Вру://мууу.зае.ог?/апдаг$/сопет/]3016_202104/), которые охватывают 
диапазон от отсутствия какой-либо автоматизации до полностью автоматизирован- 
ных транспортных средств, в которых нет водителя-человека. Были выделены сле- 
дующие уровни. 


»е Уровень 0 — автоматизация вождения отсутствует. Это отправная точка, 
описывающая, как осуществляется управление автомобилями с момента их 
изобретения. На уровне 0 водитель несет ответственность за все аспекты экс- 
плуатации автомобиля, включая достижение намеченного пункта назначения 
при обеспечении безопасности автомобиля, его пассажиров и всего, что на- 
ходится за его пределами. 


Автомобили уровня 0 могут содержать функции безопасности, такие как пре- 
дупреждение о возможном столкновении и автоматическое экстренное тор- 
можение. Эти функции отнесены к уровню 0, т.к. они не обеспечивают 
управление автомобилем в течение длительного времени. 


е Уровень 1 — система помощи водителю. На этом уровне автоматизирован- 
ная система вождения может выполнять управление рулением либо ускоре- 
нием/замедлением в течение продолжительного периода времени, но не 
обеими этими функциями одновременно. При использовании системы помо- 
щи водителю уровня 1 водитель должен непрерывно выполнять все функции 
вождения, кроме единственной автоматической функции. На уровне 1 функ- 
цию управления рулением называют удержанием полосы движения (1апе- 
Кеерше а$$15%апсе, [КА). Функцию управления ускорением/замедлением на 
уровне | называют адаптивным круиз-контролем (адарНуе сгалзе сопо|, 
АСС). При использовании функции помощи водителю этого уровня водите- 
лю необходимо постоянно контролировать обстановку, и он должен быть го- 
тов взять на себя управление автомобилем. 


е Уровень 2 — частичная автоматизация вождения. Системы автоматиза- 
ции вождения уровня 2 развивают возможности уровня 1, обеспечивая одно- 
временное управление рулением и ускорением/замедлением. Как и на уровне 1, 
водителю необходимо постоянно контролировать обстановку и в любой мо- 
мент быть готовым взять на себя управление автомобилем. 


» Уровень 3 — условная автоматизация вождения. Система автоматизации 
вождения уровня 3 может выполнять все задачи вождения в течение продол- 
жительных периодов времени. Водитель всегда должен присутствовать за ру- 
лем и быть готовым взять управление на себя, если автоматизированная сис- 
тема вождения отправит запрос на вмешательство человека. Основное 
различие между уровнями 2 и 3 заключается в том, что на уровне 3 от води- 
теля не требуется постоянно контролировать работу автоматизированной 
системы вождения или поддерживать контроль над ситуацией за пределами 
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транспортного средства. Вместо этого водитель-человек должен быть готов в 
любой момент отреагировать на запрос о вмешательстве от автоматизиро- 
ванной системы вождения. 


е Уровень 4 — высокая автоматизация вождения. Автоматизированная сис- 
тема вождения этого уровня может выполнять все задачи вождения в течение 
продолжительных периодов времени, а также способна автоматически реаги- 
ровать на неожиданные условия таким образом, чтобы свести к минимуму 
риск для автомобиля, пассажиров и других лиц за его пределами. Процесс 
минимизации рисков называют резервным режимом задачи управления дви- 
жением (дпуше 1азК аПаск), он может включать в себя действия, которые 
позволяют избежать риска и возобновить нормальное вождение или выпол- 
нить другие маневры, такие как остановка автомобиля в безопасном месте. 
Водитель-человек может взять на себя управление автомобилем, реагируя на 
переход в резервный режим, или в другое время, если это необходимо. Одна- 
ко, в отличие от более низких уровней автоматизации вождения, в автомоби- 
ле уровня 4 не требуется наличие человека, готового взять на себя управле- 
ние во время движения. Также не требуется, чтобы автомобили этого уровня 
автоматизации были оснащены органами управления для водителей-людей. 
Основная область применения систем автоматизации вождения 4-го уров- 
ня — такси и общественный транспорт, где эксплуатация транспортного 
средства ограничена определенным географическим регионом и известным 
набором дорог. 


» Уровень 5 — полная автоматизация вождения. В транспортном средстве 
уровня 5 все задачи вождения всегда выполняет автоматизированная система 
вождения. Нет необходимости в органах управления, с помощью которых во- 
дитель-человек мог бы управлять транспортным средством, — все люди в 
нем являются пассажирами. Система вождения этого уровня должна обеспе- 
чивать управление транспортным средством на дорогах любого типа, в любое 
время суток и при любых погодных условиях, при которых ответственный и, 
как правило, опытный водитель-человек мог бы безопасно управлять автомо- 
билем. Единственная задача, связанная с вождением, которую выполняют 
люди, находящиеся в автомобиле, — это выбор пункта назначения. 


В 2021 г. большинство транспортных средств на дорогах относились к уровню 0. 
Многие новые модели автомобилей оснащены функциями автоматизации уровней 
1 и 2. Во всем мире крайне мало одобренных для эксплуатации систем уровня 3. 
Для систем 3-го уровня, получивших одобрение регулирующих органов, обычно 
устанавливаются ограничения, определяющие конкретные условия эксплуатации, 
такие как вождение в условиях интенсивного движения на автомагистралях. 


Важным отличием в требованиях к производительности вычислительных систем 
для автономных транспортных средств по сравнению со многими традиционными 
вычислительными устройствами, такими как смартфоны и веб-серверы, является 
вполне реальная опасность травмирования и смерти пассажиров автомобиля и дру- 
гих лиц за его пределами. Это тема следующего раздела. 


466 Глава 16 


Аспекты безопасности 
самоуправляемых автомобилей 


В любое время, когда в движущемся автомобиле активен некоторый уровень авто- 
номного управления, алгоритмы, лежащие в основе автономного поведения, долж- 
ны постоянно применять иерархический набор требований для удовлетворения по- 
требностей пассажиров, принимая при этом все доступные меры, чтобы избежать 
негативных последствий, таких как столкновения с другими объектами. 


Наивысшим приоритетом, закодированным в алгоритмах автономного транспорт- 
ного средства, всегда должно быть обеспечение безопасности самого транспортно- 
го средства, его пассажиров и других лиц, находящихся поблизости. Рассмотрим 
альтернативу: если в качестве наивысшего приоритета выбрать доставку пассажи- 
ров в требуемый пункт назначения, то самоуправляемый автомобиль может интер- 
претировать это как разрешение проезда на красный свет и наезда на пешеходов, ес- 
ли эти действия обеспечат следование по самому быстрому пути к месту назначения. 


Такой автомобиль должен не только прогнозировать дорожную обстановку и 
управлять своим движением с учетом многочисленных препятствий, он также дол- 
жен гарантировать, что все его критически важные для безопасности компоненты 
работают должным образом и получают достоверные входные данные. Это означа- 
ет, что если эффективность работы наиболее важных датчиков, например видеока- 
мер, снижается из-за скопления снега или грязи, то алгоритмы автомобиля долж- 
ны привести систему в состояние минимального риска. В такой ситуации 
автомобиль может принять меры для обеспечения безопасности путем уведомле- 
ния водителя о необходимости взять управление на себя или выполнения оста- 
новки в безопасном месте. 


Поскольку безопасное поведение автономных транспортных средств крайне важно, 
государственные регулирующие органы, ответственные за безопасность дорожного 
движения, требуют получения одобрения для их эксплуатации на дорогах общего 
пользования. Как правило, отдельный разработчик или компания не могут создать 
автономное транспортное средство и разрешить его эксплуатацию на дорогах без 
такого одобрения. Если кто-либо сделает это, и транспортное средство станет при- 
чиной аварии или травмы, юридическая ответственность за это происшествие мо- 
жет быть возложена на находившихся в нем людей или на сторону, разрешившую 
его эксплуатацию на дорогах. 


Различные научные и коммерческие организации разработали ряд технологий, не- 
обходимых для автономного вождения, но проект полнофункционального и полно- 
стью автономного транспортного средства пока еще не представлен. Следую- 
щие четыре этапа дают приблизительное представление о возможностях автоном- 
ного вождения, которые были продемонстрированы и потребуются для достижения 
5-го уровня. 


е Этап 1. Следование дороге. Автоматизированная система вождения, обеспе- 
чивающая следование дороге, способна обнаруживать дорожную разметку, 
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включая линии, разграничивающие полосы движения, и следовать ей, а также 
может обнаруживать изменение текстуры покрытия проезжей части и обочи- 
ны на дорогах без разметки. Система вождения, которая лишь удерживает ав- 
томобиль в пределах полосы движения, не выполняет таких необходимых для 
вождения функций, как соблюдение правил дорожного движения и объезд 
других транспортных средств. 


е Этап 2. Соблюдение правил дорожного движения. На этом этапе система 
автоматизации вождения может удерживать автомобиль в пределах полосы 
движения, а также обнаруживать и выполнять указания дорожных знаков и 
светофоров по разрешенным направлениям движения. Система с таким уров- 
нем возможностей способна надежно реагировать на дорожные знаки, пре- 
доставляющие информацию для вождения, такую как ограничение скорости 
или требование уступить дорогу на перекрестке. 


е Этап 3. Избегание препятствий. Система вождения, способная избегать 
препятствий, удерживает автомобиль в полосе движения и обеспечивает вы- 
полнение требований сигналов регулирования дорожного движения, а также 
обнаруживает все значимые движущиеся или неподвижные объекты вблизи 
автомобиля и реагирует соответствующим образом, чтобы свести к миниму- 
му риск для всех. К препятствиям относятся другие транспортные средства, 
велосипедисты, пешеходы, животные, дорожные сооружения, мусор на про- 
езжей части и другие помехи движению, возникающие в необычных ситуа- 
циях, например затопленные или размытые участки дороги. 


» Этап 4. Надежное разрешение пограничных ситуаций. Может показаться, 
что автоматизированная система вождения, которая справляется с первыми 
тремя этапами, перечисленными выше, является достаточно качественной 
для разрешения ее эксплуатации, однако самый сложный аспект автоматизи- 
рованного вождения заключается в способности системы должным образом 
справляться с редкими, но важными ситуациями, в которых от водителя- 
человека можно ожидать надлежащей реакции. Например, предположим, что 
наводнение привело к обрушению части моста в реку. 


Движущийся по мосту автомобиль, управляемый человеком, в идеальном 
случае должен остановиться, когда водитель заметит, что часть моста отсут- 
ствует. Для того чтобы доверять возможностям автоматизированной системы 
вождения, пассажиры автономного транспортного средства должны быть 
уверены, что она будет адекватно реагировать во всех ситуациях, в которых 
компетентный водитель-человек сможет эффективно минимизировать риски 
для всех людей внутри и снаружи автомобиля. 


Более будничным примером таких возможностей является ситуация, когда 
два автомобиля почти одновременно подъезжают к равнозначному четырех- 
стороннему перекрестку с разных направлений. Один водитель может подать 
другому знак рукой, чтобы тот проехал перекресток. Если второго водителя 
замещает автономная система, обнаружит ли она такой жест и отреагирует ли 
на него соответствующим образом? 
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Достижение способности реагировать на редкие, но потенциально опасные события 
на этапе 4 может показаться логическим продолжением возможностей, описанных 
для первых трех этапов, однако этот сценарий на самом деле представляет собой 
серьезную проблему для автоматизированной системы вождения. Как мы увидим 
позже в этой главе, нейронные сети являются основной технологией, используемой 
в настоящее время для создания автоматизированных систем вождения. Нейронные 
сети учатся на серии примеров ситуаций, представленных им вместе с "правиль- 
ным" ответом, который сеть должна выдавать в каждой ситуации. Эти сети проде- 
монстрировали потрясающую способность делать выводы из представленных им 
ситуаций и правильно реагировать на новые ситуации, которые укладываются в 
рамки учебных сценариев, изученных сетью. 


Процесс работы с ситуациями, которые в определенном смысле находятся "между". 
сценариями обучения сети, называют интерполяцией. Проблемы возникают, когда 
нейронные сети пытаются перенести обобщения на сценарии, которые выходят за 
рамки сценариев их обучения. Этот процесс называют экстраполяцией. Основан- 
ная на экстраполяции реакция нейронной сети на новую ситуацию может соответ- 
ствовать, а может и не соответствовать тому, что посчитал бы правильным компе- 
тентный водитель-человек. Эффективное решение очень большого числа редких, 
но возможных сценариев вождения, с которыми водители-люди сталкиваются еже- 
дневно, может быть самой большой проблемой, стоящей перед разработкой систем 
автономного вождения. 


В следующем разделе представлены входные данные, предоставляемые системам 
автономного вождения различными датчиками, установленными в транспортном 
средстве. 


Требования к аппаратным средствам 
м программному обеспечению 
Аля самоуправляемых автомобилей 


Водители-люди должны контролировать состояние своих транспортных средств и 
постоянно оценивать окружающую обстановку, отслеживая движущиеся и непод- 
вижные препятствия. Основным средством сбора этой информации является зрение. 


Используя зрение, опытный водитель следит за приборами своего автомобиля, 
главным образом за спидометром, и наблюдает за окружающей обстановкой, чтобы 
удерживать автомобиль в полосе движения, соблюдать безопасное расстояние до 
других транспортных средств, требования дорожных знаков и светофоров, а также 
избегать любых препятствий на поверхности проезжей части или вблизи нее. 


Водители-люди в меньшей степени полагаются на другие органы чувств, включая 
использование слуха для обнаружения таких сигналов, как автомобильные гудки и 
сигнализация на железнодорожных переездах. Чувство осязания также вступает в 
игру, когда, например, на поверхности проезжей части устанавливаются шумовые 
полосы, предупреждающие о приближении к перекрестку. Осязание также может 
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помочь, когда невнимательный водитель съезжает с проезжей части на обочину, 
текстура которой обычно существенно отличается от поверхности проезжей части 
дороги. 


Зрение, слух и осязание — это исчерпывающий список каналов получения входной 
информации, которые водитель-человек использует во время вождения. С одной 
стороны, поступающая от этих органов чувств информация позволяет водителям- 
людям преодолевать, в основном успешно, миллиарды миль каждый день. С дру- 
гой, очевидно, что в процессах распознавания опасных ситуаций и принятия над- 
лежащих мер реагирования на них сохраняются значительные пробелы, о чем сви- 
детельствуют тысячи смертей, ежедневно происходящих вследствие дорожно- 
транспортных происшествий. 


Для того чтобы водители приняли системы автономного вождения, эти системы 
обязаны быть не просто такими же безопасными, как водители-люди, — они долж- 
ны намного превосходить их по таким показателям, как количество дорожно- 
транспортных происшествий на пройденный километр. Такой высокий уровень ра- 
бочих характеристик будет необходим, т. к. многие водители-люди будут неохотно 
передавать управление автоматизированной системе, пока не убедятся, что она пре- 
восходит их собственный (возможно, надуманный) уровень водительских навыков. 


В следующем разделе представлены типы датчиков, используемых в системах ав- 
тономного вождения, и их вклад в достижение целей по безопасности и надежности. 


Наблюдение за состоянием транспортного средства 
и его окружением 


Датчики, используемые для автономного вождения, должны точно оценивать со- 
стояние самого транспортного средства, а также положение и скорость (в данном 
случае скорость — это сочетание скорости и направления движения) всех значи- 
мых объектов, находящихся вблизи транспортного средства. В следующих разде- 
лах описываются основные типы датчиков, используемых в конструкциях совре- 
менных автономных транспортных средств. 


СР$, спидометр и инерциальные датчики 


Автономное транспортное средство должно постоянно контролировать свое со- 
стояние, включая местоположение, направление движения и скорость. Информация 
о местоположении транспортного средства используется как для низкоуровневых 
задач вождения, таких как удержание полосы движения, так и для функций более 
высокого уровня, таких как построение маршрута движения к месту назначения. 


Для определения местоположения на низком уровне можно использовать данные 
лидара или изображения с видеокамер, которые предоставляют подробную инфор- 
мацию, вплоть до положения автомобиля относительно линий разметки полосы 
движения. Эти данные имеют высокое разрешение (точность доходит до сантимет- 
ров) и обновляются с высокой скоростью (возможно, десятки или даже сотни раз в 
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секунду), что обеспечивает плавную и непрерывную реакцию системы автономного 
вождения на изменяющиеся условия. 


Данные, предоставляемые приемником глобальной системы позиционирования 
(21оба| розопшрй зубет, ОРЗ), обновляются реже (возможно, несколько раз в се- 
кунду) и могут иметь гораздо меньшую точность — погрешность определения ме- 
стоположения способна достигать нескольких метров. Информация, предоставляе- 
мая ОР5-приемником, идеально подходит для планирования маршрута, но точность 
таких измерений невелика и обновляются они слишком редко, чтобы быть полез- 
ными для удержания автомобиля в полосе движения. 


Приемники СР$ имеют существенное ограничение работоспособности, поскольку в 
своей работе они полагаются на непрерывный прием спутниковых сигналов. В си- 
туациях, когда видимость неба из автомобиля ухудшается, например на дороге в 
густом лесу, на узкой улице среди высоких домов в центре города или в тоннеле, 
ОР5-приемник может вообще не работать. 


Спидометр обычно обеспечивает точное измерение скорости транспортного сред- 
ства на основе скорости вращения колес. Иногда показания спидометра могут не- 
точно отражать скорость автомобиля вследствие пробуксовки колес из-за наличия 
на проезжей части грязи или льда. В качестве дублера спидометра можно исполь- 
зовать ОР5-приемник, который достаточно точно измеряет скорость автомобиля, 
если получает необходимые спутниковые сигналы. В этой ситуации расхождение 
между показаниями спидометра автомобиля и скоростью, измеренной СРЗ- 
приемником, может свидетельствовать о пробуксовке колес, что является небезо- 
пасным явлением. 


Современные транспортные средства часто содержат инерциальные датчики в виде 
акселерометров или, в некоторых случаях, гироскопа. Акселерометр измеряет 
ускорение, или темп изменения скорости, вдоль одной оси движения. Люди ощу- 
щают ускорение как силу, вдавливающую их в сиденье, когда автомобиль набирает 
скорость, и как силу, толкающую их вбок во время резкого поворота. 


Автомобили обычно содержат два акселерометра: один для измерения ускорения и 
замедления вдоль продольной оси (вперед-назад), а второй — для измерения уско- 
рения вдоль поперечной оси (из стороны в сторону). Акселерометр, измеряющий 
ускорение в поперечном направлении, позволяет оценивать инерционные эффекты 
поворотов. Гироскоп можно использовать для непосредственного измерения скоро- 
сти поворота автомобиля. 


Акселерометры могут выполнять измерения с очень высокой скоростью и исполь- 
зуются для таких целей, как приведение в действие подушек безопасности в тече- 
ние миллисекунд после обнаружения столкновения. Акселерометры и гироскоп в 
транспортном средстве отслеживают его ориентацию и скорость, позволяя осуще- 
ствлять точный контроль его положения относительно окружения. 


Используя алгоритм, называемый фильтром Калмана, можно комбинировать из- 
мерения из нескольких источников, например СР5-приемника и инерциальных 
датчиков, с математической моделью физических законов, которые ограничивают 
движение объектов, таких как автомобиль. Процесс калмановской фильтрации учи- 
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тывает, что каждое измерение содержит некоторую ошибку, а математическая мо- 
дель является несовершенным представлением динамического поведения автомо- 
биля. Учитывая характеристики статистической погрешности датчиков и диапазон 
непредсказуемого поведения, с которым может столкнуться транспортное средство 
(в результате ускорения, торможения и поворота руля, а также внешних воздейст- 
вий, таких как движение на подъем и под уклон), фильтр Калмана синтезирует дос- 
тупную информацию для получения оценки состояния транспортного средства, ко- 
торое является значительно более точным, чем информация, полученная от любого 
датчика или математической модели самих по себе. 


ОР5-приемник, спидометр и инерциальные датчики дают оценку состояния самого 
транспортного средства. Для безопасного управления им и достижения требуемого 
пункта назначения автономная система вождения также должна воспринимать ок- 
ружающую транспортное средство среду. В следующих разделах рассматриваются 
датчики, выполняющие эту функцию. 


Видеокамеры 


Некоторые системы автономного вождения в качестве основного датчика окру- 
жающей обстановки используют множество видеокамер. Применяемые в таких ав- 
томобилях видеокамеры имеют функции, знакомые пользователям цифровых ви- 
деокамер потребительского класса, включая портативные устройства и 
видеокамеры в смартфонах. Видеокамера автономного транспортного средства — 
это устройство с умеренно высоким разрешением, обычно 1920 х 1080 пикселов. 
Автомобиль может быть оснащен несколькими расположенными по его периметру 
камерами с перекрывающимися полями обзора. 


Применение множества камер подчеркивает одно из преимуществ автономных 
транспортных средств по сравнению с автомобилями, управляемыми человеком: 
установленные в них системы технического зрения способны одновременно и не- 
прерывно отслеживать ситуацию вокруг транспортного средства во всех направле- 
ниях. Водители-люди, для сравнения, могут в каждый момент времени смотреть 
только в одном направлении, располагая некоторым ограниченным периферийным 
зрением вокруг более крупного основного поля зрения. Наличие внутренних и 
внешних зеркал в транспортных средствах, управляемых человеком, помогает не- 
сколько компенсировать это неотъемлемое ограничение человеческого зрения, хотя 
обычно существуют довольно обширные слепые зоны, о которых водители-люди 
должны знать и которые должны учитывать при оценке ситуации. 


Самая большая проблема, связанная с использованием видеокамер в системах ав- 
тономного вождения, заключается в том, что видеоизображения, выводимые этими 
устройствами, не несут непосредственной пользы для выполнения задач вождения. 
Для того чтобы выделить на изображениях существенные признаки, объединить их 
для распознавания отдельных объектов, а затем понять, что делают эти объекты, и 
отреагировать соответствующим образом, необходимо выполнить серьезную обра- 
ботку изображений. Мы обсудим обработку видеоизображений в системах авто- 
номного вождения в разд. "Распознавание окружающей обстановки" далее в этой 
главе. 
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Радар 


Одно из ограничений видеокамер в системах автономного вождения заключается в 
том, что они формируют плоское двумерное изображение сцены, просматриваемой 
камерой. Без существенной дополнительной обработки невозможно определить, 
находится ли часть сцены, представленная каким-либо отдельным пикселом, близ- 
ко к транспортному средству (и поэтому представляет собой потенциальное пре- 
пятствие, требующее немедленной реакции) или далеко от него и не имеет отноше- 
ния к задаче вождения. 


Частично решить эту проблему помогает технология радиолокационного обнару- 
жения и измерения дальности (гад1о деесНоп апд гапр1пр, гаДаг). Радарная систе- 
ма периодически отправляет импульсы электромагнитной энергии в окружающую 
среду и воспринимает отражения этих сигналов от объектов, находящихся побли- 
Зости. 


Радар может обнаруживать объекты и определять направление на каждый объект, 
а также дальность до этих объектов. Он также способен измерять скорость объек- 
тов относительно транспортного средства, на котором установлена радарная система. 
Радар может отслеживать транспортное средство, находящееся впереди на расстоя- 
нии нескольких сотен метров, и помогать поддерживать безопасную дистанцию 
при использовании в составе системы адаптивного круиз-контроля (АСС). 


Однако радарные системы имеют некоторые существенные ограничения. По срав- 
нению с видеокамерой сцена, воспринимаемая типичным автомобильным радаром, 
намного более размыта и имеет меньшее разрешение. Радарные системы также 
подвержены помехам при измерениях, что снижает уверенность в качестве предос- 
тавляемой ими информации. 


Несмотря на эти ограничения, радарные датчики работают без снижения эффек- 
тивности в ситуациях, когда видеокамеры теряют способность нормально функ- 
ционировать, например при сильном дожде, снеге и густом тумане. 


Лидар 


Вместо видеокамер некоторые разработчики автономных транспортных средств 
решили доверить решение задач определения местоположения и ориентации 
транспортного средства и обнаружения объектов вблизи него лазерным системам. 
Технология лазерного обнаружения и измерения дальности (Из даесноп апа 
гап?11р, |14аг) использует лазер для сканирования местности вокруг автомобиля и 
сбора данных посредством восприятия отражений от поверхностей и объектов. 


Каждое измерение лидара представляет собой расстояние от лазерного устройства 
подсветки до поверхности, которая отражает часть лазерной энергии обратно на 
лидар. Направление лазерного луча относительно транспортного средства во время 
каждой серии измерений известно программному обеспечению лидара. Расстояние 
до точки отражения и обратно вычисляется с помощью измерения интервала вре- 
мени между моментом испускания лазерного импульса и.возвращением эхосигнала 
на лидар, который называется временем прохождения импульса. Расстояние, прой- 
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денное импульсом до цели и обратно, равно времени прохождения импульса, ум- 
ноженному на скорость света в атмосфере. 


Результатом быстрых последовательных измерений во всех направлениях вокруг 
транспортного средства является создание трехмерного набора точек, называемого 
облаком точек. Оно представляет расстояния от лидарного датчика до окружаю- 
щих поверхностей, включая дорожное покрытие, здания, транспортные средства, 
деревья и другие объекты. 


Сонар 


Технология обнаружения и определения дальности с помощью звуковых волн 
(зоип4 пау1гайоп ап4 гапо1пре, зопаг) выполняет функцию, аналогичную функциям 
радарных и лидарных систем, за исключением того, что сонары излучают звуковые 
импульсы, а не электромагнитные волны. 


Сонары обычно работают на гораздо меньших расстояниях, чем радары и лидары, 
и в основном используются для обнаружения препятствий, находящихся в непо- 
средственной близости от автомобиля, например при парковке между другими ав- 
томобилями или для обнаружения ситуаций, когда автомобиль, следующий по со- 
седней полосе, приближается к вам на недопустимо близкое расстояние. 


Распознавание окружающей обстановки 


Поскольку датчики собирают необработанную информацию об автомобиле и его 
окружении, выходные данные датчика нельзя сразу же использовать для эффектив- 
ного управления автомобилем. Необходимо выполнить несколько этапов обработ- 
ки, чтобы преобразовать необработанные измерения датчиков в полезную инфор- 
мацию, которую можно использовать для автономного вождения. В следующих 
разделах описываются этапы обработки, необходимые для преобразования данных 
датчиков в решения об управлении автономными транспортными средствами, ко- 
торые полагаются на видеокамеры и лидары в качестве основных датчиков. Мы 
начнем с обработки изображений с видеокамер с использованием сверточных ней- 
ронных сетей. 


Сверточные нейронные сети 


В главе 6 были кратко представлены концепции глубокого обучения и искусствен- 
ных нейронных сетей. Напомню, что искусственные нейроны — это математиче- 
ские модели, предназначенные для воспроизведения поведения биологических 
нейронов, которые являются клетками мозга, ответственными за восприятие и при- 
нятие решений. 


В современных автономных транспортных средствах, которые используют видео- 
камеры для оценки окружающей обстановки, ведущей технологией извлечения ин- 
формации для принятия решений из получаемых от камер видеоизображений явля- 
ется сверточная нейронная сеть. 
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Сверточная нейронная сеть (Сопуошбопа! пеига| пебмогК, СММ) — это специали- 
зированный тип искусственной нейронной сети, которая применяет определенную 
форму фильтрации, называемую сверткой, к данным необработанных изображений, 
чтобы извлечь информацию для обнаружения и идентификации объектов на изо- 
бражениях. 


Изображение, снятое видеокамерой, представляет собой прямоугольную сетку пик- 
селов. Цвет каждого пиксела представлен набором значений интенсивности крас- 
ного, зеленого и синего цветов. Каждое из этих значений интенсивности представ- 
ляет собой 8-битное целое число в диапазоне от 0 до 255. Интенсивность 0 
означает, что соответствующий цвет отсутствует в цвете пиксела, в то время как 
255 представляет максимальную интенсивность данного цвета. Цвет пиксела пред- 
ставлен тремя значениями для красного, зеленого и синего цветов, сокращенно 
обозначаемых ВСВ. Некоторые примеры цветов ВОВ представлены в табл. 16.1. 


Таблица 16.1. Примеры цветов в формате ЮСВ 


Интенсивность | Интенсивность | Интенсивность Цвет 
красного цвета | зеленого цвета | синего цвета 


ПБ ПОВ ПО 
В ОЕ ОСИ 
ро [в [о | 


[в [о | жы 
о [9 [пы | 
о [№ [бое 


Сеть СММ получает в качестве входных данных снятое видеокамерой ВОВ-изобра- 
жение в виде трех отдельных двумерных массивов 8-битных значений (цветов пик- 
селов) для красного, синего и зеленого цветов. Мы будем называть их тремя цве- 
товыми плоскостями изображения. 


Затем СММ выполняет сверточную фильтрацию для каждой из цветовых плоско- 
стей. Сверточный фильтр состоит из прямоугольной сетки чисел, которая обычно 
имеет небольшой размер, например две строки на два столбца. Операция свертки 
начинается с левого верхнего угла каждой цветовой плоскости. С математической 
точки зрения свертка выполняется путем умножения интенсивности цвета в пози- 
ции каждого пиксела на число в соответствующем месте сверточного фильтра и 
последующего суммирования результатов этих операций по всем элементам 
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фильтра. Результатом этой операции является один элемент, полученный в итоге 
свертки. Вскоре мы рассмотрим пример, который поможет прояснить этот процесс. 


Свертка продолжается смещением фильтра на один или более пикселов вправо с 
последующим повторением операций умножения и суммирования с пикселами 
изображения, охваченными новым местоположением фильтра. Эти операции при- 
водят к получению результата свертки для второй позиции в верхней строке. Дан- 
ный процесс продолжается по всей верхней строке изображения, после чего фильтр 
смещается обратно к левому краю и перемещается на один или более пикселов 
вниз, и процесс повторяется для второй строки изображения. Эта последователь- 
ность смещения фильтра, умножения элементов фильтра на интенсивность цвета 
пикселов в местоположении фильтра и суммирования результатов продолжается по 
всему изображению. 


Пример реализации сверточной нейронной сети 


Теперь мы разберем простой пример, чтобы продемонстрировать, как работают се- 
ти СММ. Допустим, у нас есть изображение размером 5х 5 пикселов и сверточный 
фильтр размером 2х2 пиксела. Мы рассмотрим только одну из трех цветовых 
плоскостей, хотя в реальных фильтрах одни и те же операции будут выполняться 
отдельно для всех трех цветовых плоскостей. 


Мы будем сдвигать фильтр на один пиксел вправо и на один пиксел вниз каждый 
раз, когда потребуется такое перемещение. Расстояние (в пикселах), на которое 
сверточный фильтр сдвигается при каждом перемещении, называется шагом по 
индексу. Для простоты все пикселы и элементы сверточного фильтра в этом при- 
мере будут представлены в виде однозначных целых чисел. В табл. 16.2 приведен 
пример данных нашей цветовой плоскости. 


Таблица 16.2. Пример данных цветовой плоскости 


Табл. 16.3 содержит сверточный фильтр. Каждое число в таблице представляет со- 
бой один коэффициент фильтрации: 


Таблица 16.3. Пример сверточного фильтра 
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Мы будем использовать шаг по индексу 1. Это означает, что для каждой последо- 
вательной оценки выходных данных фильтра будет выполняться сдвиг на 1 пиксел 
вправо, а затем на | пиксел вниз с возвратом к левому краю, когда будет достигнут 
правый край изображения. 


Для первой оценки фильтра мы умножаем пикселы в левом верхнем углу изобра- 
жения на соответствующие элементы из сверточного фильтра (табл. 16.4). 


Таблица 16.4. Шаг умножения при выполнении свертки 


После умножения интенсивностей цветовой плоскости на элементы фильтра сверт- 
ки в сетке 2х 2 мы складываем их вместе, как показано в уравнении (16.1). 


С. = (1х7) + (4х2) + (2х 8) + (9х0) =31. (16.1) 
Результат поэлементного умножения интенсивностей цветовой плоскости на коэф- 
фициенты фильтра с последующим суммированием каждого из этих произведений 
является одним элементом нашего выходного массива, С! 1. Этот результат мы по- 
мещаем в ячейку на пересечении строки | и столбца 1 выходного массива, как по- 
казано в табл. 16.5. 


Таблица 16.5. Первый выходной элемент свертки 


Затем мы сдвигаем сетку фильтра на одну позицию вправо и снова выполняем опе- 
рации умножения и суммирования, как показано в табл. 16.6. 


Таблица 16.6. Шаг умножения при выполнении свертки 
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Результат умножения интенсивностей цветовой плоскости на элементы сверточно- 
го фильтра во второй позиции показан в уравнении (16.2). 


С12= (4х7) + (6х2) + (9х8) + (2х 0) = 112. (16.2) 
В табл. 16.7 представлен результат свертки после ввода второго элемента в ячейку 
на пересечении строки 1 и столбца 2. 


Таблица 16.7. Второй выходной элемент свертки 


Мы продолжаем смещать фильтр на один пиксел вправо для получения каждой 
оценки в верхней строке. Поскольку наш фильтр имеет ширину 2 пиксела, а изо- 
бражение — 5 пикселов, мы можем разместить фильтр, не допуская его выхода за 
пределы изображения, только в четырех позициях. По этой причине выходной мас- 
сив фильтра содержит 4 строки и 4 столбца. 


После завершения расчетов для верхней строки изображения мы возвращаем 
фильтр к левому краю изображения и перемещаем его на один пиксел вниз, чтобы 
вычислить элемент в ячейке на пересечении строки 2 и столбца 1 (С>1). Эта проце- 
дура повторяется для всего изображения вплоть до ее завершения в правом нижнем 
углу. Итоговый результат операции свертки для нашего изображения размером 
5х 5 пикселов показан в табл. 16.8. 


Таблица 16.8. Результат операции свертки 


Это объяснение операции свертки могло показаться вам несколько утомительным и 
малополезным, но теперь мы переходим к хорошей части. 


Сверточные нейронные сети 
в системах автономного вождения 


Ниже перечислены наиболее интересные моменты, связанные с использованием 
сверточной фильтрации для обработки видеоизображений в системах автономного 
вождения. 


е Математически свертка состоит из простых операций умножения и сло- 
жения. 
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» Сверточные нейронные сети (СММ) можно обучать таким же образом, как и 
искусственные нейронные сети (Агийсла| пеига! пебхогк, АММ), обсуждав- 
шиеся в главе 6. Их обучение состоит из повторных испытаний, в которых 
нейронной сети предоставляют набор входных данных вместе с "правиль- 
ным" выводом, который должен быть получен при вводе в нее этих данных. 
Процесс обучения корректирует веса внутри АММ (и в фильтрах свертки 
СММ), чтобы улучшить способность сети правильно реагировать на заданные 
входные данные на каждой итерации. 


» В рамках процесса обучения СММ определяет наилучшие значения данных 
для размещения в каждой ячейке своих таблиц сверточных фильтров. 


В качестве конкретного примера рассмотрим задачу управления транспортным 
средством, которая заключается в его удержании по центру занимаемой полосы 
движения. Общая процедура обучения СММ выполнению этой задачи заключается 
в записи серии видеофрагментов с камер автомобиля вместе с соответствующими 
сигналами рулевого управления, которые автономная система должна попытаться 
воспроизвести в качестве выходных данных. 


Обучающий набор данных должен быть достаточно разнообразным, чтобы гаран- 
тировать, что изучаемое СММ поведение охватывает весь диапазон предполагаемых 
условий эксплуатации. Это означает, что данные для обучения должны включать в 
себя вождение по прямым дорогам и дорогам с различными изгибами. Эти данные 
также должны описывать вождение в дневное и ночное время и в других возмож- 
ных условиях, такие как различные погодные условия. 


Во время обучения каждый обучающий пример предоставляется сети в виде видео- 
изображения вместе с правильной реакцией рулевого управления. По мере того как 
СММ учится правильно реагировать на изменяющиеся входные данные, она кор- 
ректирует коэффициенты в своих сверточных фильтрах для выявления особенно- 
стей изображения, которые полезны при выполнении требуемых задач. 


Одной из функций обработки изображений, которая особенно полезна при авто- 
номном вождении, является обнаружение краев. Оно включает в себя определение 
местоположения разграничительных линий, которые отделяют различающиеся час- 
ти изображения друг от друга. Например, линии разметки, нанесенные на проез- 
жую часть, всегда сильно отличаются по цвету от дорожного покрытия, что делает 
их хорошо заметными как для водителей-людей, так и для автономных систем. 


Наиболее интересное и даже захватывающее свойство процесса обучения сети 
СММ заключается в том, что в результате простой демонстрации СММ видеокадров 
поверхности дороги в сочетании с точными примерами требуемых выходных дан- 
ных СММ будет обнаруживать полезные атрибуты изображения (например, края) и 
автоматически создавать сверточные фильтры, которые специально настроены для 
выявления полезных особенностей изображений. 


Поскольку фильтр СММ применяется многократно по всему изображению, он мо- 
жет обнаруживать объекты в любом месте изображения, где бы они ни появлялись. 
Это важная особенность автономного вождения, т.к. место появления важного 
объекта на видеоизображении предсказать невозможно. 
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На практике СММ могут содержать несколько сверточных фильтров, каждый из 
которых содержит разные наборы коэффициентов. Каждый из этих фильтров на- 
страивается в процессе обучения для поиска разных типов особенностей, результа- 
ты которого могут быть обработаны на более поздних этапах работы сети для вы- 
полнения функций более высокого уровня, таких как обнаружение знаков 
остановки, светофоров и пешеходов. 


Полная структура СММ содержит один или несколько этапов свертки, каждый из 
которых работает так, как описано в этом разделе. На начальном этапе свертки вы- 
полняется фильтрация для обнаружения простых объектов, таких как границы, а на 
более поздних этапах эти объекты объединяются для обнаружения более сложных 
объектов, таких как знак остановки. 


Для надежного обнаружения такого объекта, как знак "Стоп", в различных услови- 
ях обучающие данные должны содержать изображения этих знаков, видимых вбли- 
зи и издалека, а также при взгляде на них прямо и сбоку под углом, и все это при 
различном освещении и при разной погоде. 


В структуре СММ элементы. данных, вычисленные на каждом этапе свертки, про- 
пускаются через функцию активации для получения конечного результата этапа. 
Для этой цели можно использовать множество функций, однако общепринятой 
функцией активации является блок линейной ректификации, обозначаемый со- 
кращением ВЕГО (ВесиЯе4 Глпеаг Опи). 


Функция активации КЕГО представляет собой очень простую формулу: проверьте 
каждый элемент таблицы выходных значений операции свертки, такой как показа- 
на в табл. 16.8. Если элемент меньше 0, замените его на 0. Вот и всё, что требуется. 
Наш простой пример в табл. 16.8 не содержит отрицательных элементов, поэтому 
применение функции КЕГХО его не изменит. На практике функция активации КЕГО 
дает важные преимущества, включая повышенную скорость обучения по сравне- 
нию с другими распространенными функциями активации. 


Другим этапом, используемым в архитектурах СММ, является этап группировки. 
Изображения высокого разрешения содержат большое количество пикселов. Для 
того чтобы ограничить потребление памяти и требования к обработке разумными 
пределами, необходимо уменьшить количество проходящих через сеть данных, со- 
хранив при этом характерные особенности, которые обеспечивают правильное рас- 
познавание объектов на изображении. Одним из способов решения этой задачи яв- 
ляется подход, называемый группировкой. Группировка объединяет несколько 
элементов таблицы входных данных в один элемент выходной таблицы. Например, 
каждое подмножество 2х2 пиксела из табл. 16.8 можно сгруппировать, чтобы 
уменьшить размер выходных данных этого подмножества до одного числового 
значения. 


Есть несколько способов группировки пикселов внутри подмножества для получе- 
ния одного значения. Одна из очевидных возможностей заключается в вычислении 
среднего значения. Для области размером 2х2 пиксела в левом верхнем углу 
табл. 16.8 среднее значение равно (31 + 112 + 96 + 83) / 4 = 80,5. Усреднение дает 
представление, сочетающее в себе эффекты от всех пикселов в данной области, од- 
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нако этот метод группировки не зарекомендовал себя как обеспечивающий наи- 
лучшие показатели в СММ. Вместо этого во многих случаях было продемонстриро- 
вано, что хорошие показатели обеспечивает простой выбор в качестве результата 
группировки максимального значения в пределах области. В этом примере макси- 
мальное значение в выбранной области равно 112. 


Этот подход называется группировкой с выбором максимума. В табл. 16.9 пред- 
ставлены результаты группировки с выбором максимума для области размером 
2х2 к табл. 16.8. 


Таблица 16.9. Результат группировки с выбором максимума 
для данных из табл. 16.8 


Для того чтобы преобразовать слой из двумерной структуры видеоизображений и 
сверточных слоев, преобразующих видеоданные, в форму, подходящую для ввода в 
традиционную АММ, необходимо перевести эти данные в одномерный формат. 


Как и в случае с другими математическими операциями, описанными ранее, это 
простая процедура. Преобразование двумерной структуры в одномерный вектор 
называется сглаживанием. В сглаживающем слое коэффициенты в двумерной 
структуре просто последовательно переносятся в вектор, который выступает в ка- 
честве входных данных для традиционной АММ. 


В табл. 16.10 представлены результаты выполнения операции сглаживания над 
данными из табл. 16.9. 


Таблица 16.10. Результат сглаживания данных из табл. 16.9 


В табл. 16.10 представлен одномерный вектор числовых значений, который имеет 
подходящий формат для использования в качестве входных данных в традицион- 
ной АММ. 


После этапов свертки, группировки и сглаживания СММ реализует один или не- 
сколько уровней АММ, каждый из которых образует скрытый слой нейронов. Эти 
скрытые слои обычно представляют собой полностью связанные наборы нейронов, 
как показано на рис. 6.5 в главе 6. За скрытым слоем следует выходной слой, кото- 
рый представляет конечные выходные данные сети для использования в дальней- 
шей обработке. 


Когда достаточно представительный набор данных для обучения объединен со 
структурой СММ соответствующего размера, способной к обучению и сохранению 
необходимых знаний, появляется возможность закодировать в коэффициентах СММ 


Архитектуры для самоуправляемых автомобилей 481 


и АММ огромный объем информации, представляющей широкий спектр сценариев 
вождения. 


При проектировании автономного транспортного средства, пригодного для экс- 
плуатации на дорогах общего пользования, результатом процесса проектирования и 
обучения СММ является система, способная распознавать и идентифицировать ти- 
пы объектов, встречающиеся во всем спектре дорожных ситуаций, с которыми 
ежедневно сталкиваются водители. Это чрезвычайно сложная задача, и может 
пройти несколько лет, прежде чем возможности вычислительных технологий и 
программного обеспечения (как в структуре сети, так и в процессе обучения) будут 
способны стабильно превосходить водителей-людей в задачах обнаружения и рас- 
познавания объектов. 


На рис. 16.1 представлена базовая (соответствующая описанному выше этапу 1) 
архитектура СММ, которая показала свою способность управлять системой авто- 
номного вождения, чтобы удерживать автомобиль в занимаемой им полосе движе- 
ния на извилистой дороге. 


&СВ-изображение 
Свертка № 1 и КЕЦУ 
Группировка с выбором максимума 
Свертка № 2 и КЕЦ] 
Группировка с выбором максимума 
Свертка № 3 и КЕЕШУ 
Сглаживание 


Плотная АММ 


Плотный вывод 


Идентификация объектов 
Рис. 16.1. Уровни СММ, используемые для идентификации объектов 


В упражнениях в конце этой главы разрабатывается пример СММ, основанной на 
структуре, показанной на рис. 16.1, которая может идентифицировать и классифи- 
цировать объекты на цветных изображениях низкого разрешения со значительной 
степенью точности. 
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Вы можете задаться вопросом: как разработчик СММ выбирает архитектурные осо- 
бенности сети, такие как типы и количество слоев и другие параметры, для кон- 
кретной прикладной задачи? Во многих случаях совсем не ясно, какой должна быть 
наилучшая комбинация типов слоев и других параметров сети (таких как размеры 
фильтра свертки) для достижения общих целей приложения на основе СММ. 


Типы и размеры слоев и связанные с ними параметры, описывающие нейронную 
сеть, называются гиперпараметрами. Гиперпараметр — это высокоуровневый ат- 
рибут нейронной сети, который определяет некоторую часть ее структуры. Гипер- 
параметры отличаются от весовых коэффициентов (см. рис. 6.4) на нейронных свя- 
зях, которые определяются автоматически в процессе обучения. 


Выбор значений гиперпараметра для настройки нейронной сети с целью решения 
конкретной прикладной задачи можно рассматривать как процесс поиска. Разра- 
ботчик нейронной сети может использовать программные средства для тестирова- 
ния различных архитектур сети, состоящих из различных последовательностей раз- 
нотипных слоев нейронной сети, а также разных значений параметров, связанных с 
каждым слоем, таких как размеры фильтров свертки или количество нейронов в 
полносвязном слое. Процесс поиска включает в себя этап обучения для каждой 
конфигурации сети, за которым следует этап тестирования для оценки характери- 
стик обученной сети. Проекты сетей, которые показали наилучшие результаты на 
этапе тестирования, сохраняются для дальнейшей оценки по мере продвижения 
процесса проектирования. 


В следующем разделе мы рассмотрим пример использования лидара для определе- 
ния местоположения транспортного средства и распознавания объектов в его окру- 
жении. 


Определение местоположения с помощью лидара 


Как говорилось ранее, лидары измеряют расстояние до поверхностей, отражающих 
часть излучаемой лазером энергии обратно в направлении лидара. Направление 
передаваемого лазерного луча относительно транспортного средства во время каж- 
дой серии измерений известно программному обеспечению обработки данных ли- 
дара. Расстояние до точки отражения и обратно вычисляется с помощью измерения 
интервала времени между моментом испускания лазерного импульса и возвраще- 
нием эхосигнала на лидар, который называется временем прохождения импульса. 
Расстояние, пройденное импульсом до цели и обратно, равно времени прохождения 
импульса, умноженному на скорость света. 


В результате быстрых последовательных измерений во всех направлениях вокруг 
транспортного средства формируется облако точек, которое содержит полный на- 
бор измерений для точек вокруг транспортного средства. 


Сравнивая созданное лидаром облако точек с сохраненной картой поверхностей и 
сооружений вблизи местоположения транспортного средства, программное обеспе- 
чение обработки данных лидара может корректировать и подстраивать полученное 
в результате измерений облако точек, чтобы привести его в соответствие с данны- 
ми сохраненной карты. Такой процесс позволяет лидарной системе точно опреде- 


Архитектуры для самоуправляемых автомобилей 483 


лять свое местоположение и ориентацию относительно окружающей обстановки. 
Этот подход называется локализацией. 


По сравнению с системами автономного вождения, основанными на анализе видео- 
изображений, системы вождения на основе лидара обладают следующими преиму- 
ществами. 


» Лидарные датчики непрерывно создают точные трехмерные карты окру- 
жающей обстановки. Эта информация представляет собой расстояние от дат- 
чика до каждой точки в облаке точек. Одна видеокамера создает двумерное 
изображение, не содержащее информации о расстоянии до какой-либо точки 
сцены. 


® Видеокамеры могут быть ослеплены солнечным светом или другим ярким 
источником света. Лидарные датчики гораздо менее восприимчивы к таким 
помехам. 


» Функция обнаружения объектов в системах на основе видеокамер может не 
распознавать объекты, когда воспринимаемый цвет объекта недостаточно 
контрастирует с окружающей средой. Лидарные системы обнаруживают объ- 
екты в своем окружении независимо от их цвета. 


Лидарные системы имеют следующие ограничения. 
® Они имеют существенно меньшее разрешение, чем стандартные видеокамеры. 


ео Какив случае с видеокамерами, характеристики лидарных датчиков могут 
ухудшиться из-за погодных условий, таких как туман и СИЛЬНЫЙ ДОЖДЬ. 


» Лидарные системы локализации работают только на дорогах и в других сре- 
дах, которые были точно нанесены на карту. База данных, содержащая ин- 
формацию о карте, должна быть доступна транспортному средству во время 
его эксплуатации. Это требует постоянных вложений для сбора картографи- 
ческих данных о дорогах, используемых для автономного вождения. При со- 
ставлении карт необходимо повторять процесс сбора данных, чтобы выявлять 
такие изменения, как строительство новых зданий вблизи дорог. При движе- 
нии по дорогам, которые не нанесены на карту, лидарная система будет не- 
доступна для использования. 


® Лидарные системы, как правило, значительно дороже видеокамер. 


Между автопроизводителями и технологическими компаниями продолжается кон- 
куренция за разработку и внедрение систем автономного вождения на основе раз- 
личных технологий наблюдения за окружающей обстановкой. С 2021 г. Теа со- 
средоточила свои усилия на использовании нескольких видеокамер для 
предоставления информации, необходимой для выполнения функций автономного 
вождения без точной карты окружающей среды. 


Другие компании, включая Тоусйа и \/ауто, полагаются на использование лидара в 
качестве основной системы для контроля окружающей обстановки в сочетании с 
базой данных, содержащей трехмерные данные для локализации. 
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Независимо от того, использует система автономного вождения видеокамеры или 
лидарную систему, она должна распознавать объекты и отслеживать их поведение 
во времени, чтобы выполнять функции, необходимые для безопасного вождения. 
Это тема следующего раздела. 


Отслеживание объектов 


Выходные данные системы автономного вождения после этапа распознавания 
включают в себя список объектов и их классификацию (например, грузовик или 
велосипедист), полученные на основе данных видеокамеры или лидара. Для под- 
держки решения задачи вождения необходимо выполнить дополнительную обра- 
ботку для ведения истории объектов, обнаруженных в последовательных выборках 
данных от датчиков, и отслеживания поведения этих объектов с течением времени. 


Функции отслеживания объектов оценивают движение объектов и позволяют про- 
гнозировать их движение в будущем. Результаты прогнозирования движения объ- 
ектов используются при принятии решений о планировании траектории для под- 
держания безопасных дистанций до других объектов и уменьшения риска столкно- 
вений. 


Отслеживание объектов в последовательных выборках данных позволяет выявлять 
и исправлять ошибки, такие как обнаружение ложных объектов в отдельных сце- 
нах, если присутствие предполагаемого объекта не может быть подтверждено по- 
следующими выборками. 


После получения набора данных, описывающего состояние транспортного средства 
и всех объектов, имеющих отношение к управлению им, система автономного вож- 
дения должна принять ряд решений, которые будут рассмотрены далее. 


Принятие решений 


Используя информацию, полученную на этапе обработки данных, поступающих от 
датчиков, система автоматического вождения принимает решения о действиях, ко- 
торые она будет выполнять в каждый момент для продолжения безопасного движе- 
ния транспортного средства в запрошенный пункт назначения. Основные функции, 
которые она должна поддерживать, заключаются в удержании автомобиля в преде- 
лах полосы движения, соблюдении правил дорожного движения, предотвращении 
столкновений с другими объектами и планировании траектории движения. Эти те- 
мы рассматриваются в следующем разделе. 


Удержание полосы движения 


Задача удержания полосы движения требует, чтобы водитель транспортного сред- 
ства (человек или автономная система) постоянно контролировал его положение в 
пределах занимаемой полосы, не допуская превышения допустимого отклонения от 
центра полосы движения. 


Удержание полосы движения — простая задача на дороге с четкой разметкой в хо- 
роших погодных условиях. С другой стороны, система автономного вождения (или 
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водитель-человек) может испытывать значительные трудности с удержанием поло- 
сы движения, когда разметка полосы движения скрыта свежим снегом или грязью 
на поверхности дороги. 


Система автономного вождения на основе лидара не должна испытывать значи- 
тельных затруднений при движении автомобиля по дороге, покрытой тонким слоем 
снега, пока лидарные измерения окружающей обстановки продолжают предостав- 
лять достоверную информацию. При этом система, основанная на видеокамерах, 
в таких условиях может столкнуться с существенными трудностями. 


Соблюдение правил дорожного движения 


Системы автономного вождения должны соблюдать все правила дорожного движе- 
ния и нормативные требования при эксплуатации автомобиля на дорогах общего 
пользования. Сюда относятся базовые функции, такие как остановка перед знаками 
"Стоп" и надлежащее реагирование на сигналы светофора, а также другие необхо- 
димые действия, такие как предоставление права проезда другому транспортному 
средству, когда этого требует ситуация. 


Задача вождения может усложниться, когда автономным транспортным средствам 
придется делить дорогу с автомобилями, управляемыми людьми. Люди выработали 
целый ряд моделей поведения для различных дорожных ситуаций, которые призва- 
ны облегчить вождение для всех участников. Например, автомобиль на перепол- 
ненном шоссе может притормозить, чтобы освободить место для выезда на проез- 
жую часть другого автомобиля, вливающегося в транспортный поток с 
примыкающей дороги. 


Успешная система автономного вождения должна соответствовать всем законода- 
тельным требованиям и демонстрировать поведение, отвечающее ожиданиям води- 
телей-людей. 


Предотвращение столкновений 


Системы автономного вождения должны распознавать и соответствующим образом 
реагировать на всю гамму неодушевленных предметов и живых существ, с которы- 
ми водители сталкиваются на дорогах ежедневно. Это касается не только других 
транспортных средств, пешеходов и велосипедистов — случайные предметы, такие 
как лестницы, автомобильные капоты, шины и ветви деревьев, также оказываются 
на дорогах каждый день. Различные животные, например белки, кошки, собаки, 
олени, крупный рогатый скот, медведи и лоси, регулярно пытаются пересечь доро- 
гу в различных регионах. 


Водители-люди обычно стараются избегать наезда на мелких животных на дороге, 
если это можно сделать, не создавая неприемлемо опасной ситуации. При встрече с 
крупным животным предотвращение столкновения может оказаться необходимым, 
чтобы не допустить Г ибели пассажиров транспортного средства. Ожидается, что 
системы автономного вождения должны превосходить людей-водителей во всех 
этих ситуациях. 
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Планирование траектории движения 


При высокоуровневом планировании маршрута составляется последовательность 
связанных друг с другом участков дорог, по которым автомобиль должен проехать 
во время движения от начальной точки к пункту назначения. Системы планирова- 
ния маршрутов на основе СР$-приемников хорошо знакомы водителям современ- 
ных транспортных средств. Автономные транспортные средства используют тот же 
подход для планирования маршрута к пункту назначения. 


Низкоуровневое планирование маршрута включает в себя все действия по управле- 
нию на пути к пункту назначения. Система автономного вождения должна посто- 
янно оценивать окружающую обстановку и принимать решения, например, о том, 
когда менять полосу движения, когда безопасно въезжать на перекресток и когда 
отказаться от попыток повернуть налево, на улицу с оживленным движением, 
и вернуться к альтернативному маршруту. 


Как и во всех аспектах автономного вождения, высшими целями планирования 
маршрута являются обеспечение безопасности пассажиров и других лиц за преде- 
лами транспортного средства, соблюдение всех правил дорожного движения и мак- 
симально быстрое перемещение к пункту назначения с соблюдением вышеуказан- 
ных требований. 


Вычислительная архитектура автономного 
транспортного средства 


На рис. 16.2 приведена схема взаимосвязи аппаратных компонентов и этапов обра- 
ботки в системе автономного вождения на основе текущего состояния технологий, 
описанных в этой главе. 


Мы представили технологии контроля обстановки, которые помогают собирать 
информацию о состоянии автомобиля и его окружения. Эта информация поступает 
в процесс Наблюдение, который принимает данные от датчиков, проверяет пра- 
ВИЛЬНОСТЬ работы каждого датчика и подготавливает данные для распознавания. 
Процесс Распознавание принимает необработанные данные датчиков и извлекает 
из них полезную информацию, такую как выявление объектов на видеоизображе- 
ниях, определение их местоположения и скорости. После достижения точного по- 
нимания состояния транспортного средства и всех выявленных окружающих объ- 
ектов процесс Принятие решений реализует навигационные функции высокого 
уровня, такие как выбор маршрута движения в пункт назначения, а также функции 
низкого уровня, такие как выбор направления движения на перекрестке. На основе 
принятых решений процесс Действия отправляет команды аппаратным блокам, 
выполняющим руление, регулирующим скорость транспортного средства и предос- 
тавляющим информацию другим водителям, в первую очередь посредством управ- 
ления сигналами поворота. 
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Рис. 16.2. Компоненты и процессы автономной системы вождения 


Автопилот Теа Н\У/З 


Для того чтобы сохранить коммерческую тайну, некоторые автомобильные и тех- 
нологические компании, разрабатывающие системы автономного вождения, пуб- 
ликуют крайне ограниченную информацию об устройстве своих систем. В то же 
время компания Тез!а была более откровенна в отношении информации о компью- 
терном оборудовании для автономного вождения, используемом в производимых 
ею автомобилях. Автомобили Тез|а в настоящее время эксплуатируются на дорогах 
общего пользования с так называемыми возможностями полного автономного вож- 
дения, основанными на использовании компьютерной системы под названием 
Нага\уаге 3.0 (НУ\УУЗ). 


Плата процессора Тез1а Н\!З содержит две полностью резервированные вычисли- 
тельные системы, каждая из которых способна безопасно и самостоятельно управ- 
лять автомобилем. Обе системы работают синхронно, непрерывно сравнивая свои 
выходные данные. Если одна из систем выходит из строя. вторая берет управление 
автомобилем на себя до тех пор, пока не будет выполнен ремонт. 


Компьютер Н\З создан на основе специализированной системы на кристалле ($0С), 
разработанной Тез|а для оптимизации его рабочих характеристик при решении задач 
автономного вождения. В дополнение к традиционным возможностям, связанным с 
обработкой изображений и скалярными вычислениями, на чипе $0С размещены зна- 
чительные ресурсы для вычислений с использованием нейронных сетей. 


Ниже перечислены некоторые из основных особенностей компьютера Тез1а Н\З. 


» Интегральная схема 50С изготовлена с применением 14-нанометрового про- 
цесса ЕтЕЕТ и содержит в общей сложности 6 млрд транзисторов. Техноло- 
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гия ЕЕРЕТ (Еш Е1е!4-ЕЁЯес{ Тгапз1$®юг) использует вертикальную конструк- 
цию (называемую "плавником"), отличающую ее от плоской структуры тра- 
диционной технологии КМОП. Транзисторы ЕшЕЕТ обеспечивают более 
быстрое переключение и пропускают больший ток, чем традиционные 
КМОП-транзисторы. Компьютер Н\З стал первым примером применения 
14-нанометровой технологии ЕтЕЕТ в автомобилестроении. 


» В качестве ОВАМ в компьютере Н\?З используются схемы 0084 с пони- 
женным энергопотреблением (ГРООВ4). ГРООВ4 — это вариант ОКАМ 
ОРЕ4, оптимизированный для снижения энергопотребления в таких устрой- 
ствах, как смартфоны и ноутбуки. ГРООВ4 имеют меньшую пропускную 
способность по сравнению с ООК4 и потребляют значительно меньше энергии. 
Аккумулятор автомобиля Тез|а имеет гораздо большую емкость по сравнению 
с аккумулятором смартфона. Тем не менее электроэнергию, потребляемую ав- 
томобильным компьютером, необходимо свести к минимуму, и использование 
ОКАМ Г.РООВА4 помогает в решении этой задачи. 


» Каждый чип 50С содержит два ускорителя нейронных сетей, которые вместе 
обеспечивают скорость 72 тераопераций в секунду (ТОР5). Эти процессоры 
используют нейросети СММ для обнаружения объектов на изображениях ви- 
деокамер. 


» Каждый ускоритель нейронной сети имеет 32 Кбайт выделенной высокоско- 
ростной памяти ЗКАМ. Как было показано в главе $8, схемы памяти ЗКАМ 
намного быстрее КАМ, но имеют значительно более высокую стоимость за 
бит с точки зрения площади чипа. Значительный объем ЗКАМ обеспечивает 
повышение производительности по сравнению с другими процессорами об- 
щего назначения, которые Тез!а могла бы использовать вместо своих специа- 
лизированных 50С. 


» Для вычислений общего назначения каждый процессор Н\З содержит три 
четырехъядерных 64-разрядных центральных процессора АКМ Соцех А72, 
работающих на частоте 2,2 ГГц. 


Согласно данным Теа, благодаря архитектуре СММ, реализованной в компьютере 
НУ’З, он может обрабатывать впечатляющий объем видео высокой четкости — 
2300 кадров в секунду. Столь высокий уровень производительности необходим для 
достижения заявленной Тез|а цели — использовать датчики на основе видеокамер 
для обеспечения автономного вождения 5-го уровня. 


Технологии автономных транспортных средств стремительно развиваются, но те- 
кущий уровень оснащаемых ими автомобилей, доступных для приобретения широ- 
кой публикой, по-прежнему значительно отстает от цели беспилотной эксплуата- 
ции. Может пройти несколько лет, прежде чем появятся автомобили, способные 
перевозить пассажиров по дорогам общего пользования без участия человека, по- 
стоянно наблюдающего за окружающей обстановкой через лобовое стекло. 
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Резюме 


В этой главе были представлены возможности, которые должны быть реализованы 
в вычислительных архитектурах самоуправляемых автомобилей. Она началась с 
представления уровней автономности вождения и обсуждения требований по обес- 
печению безопасности самоуправляемого автомобиля и его пассажиров, а также 
безопасности других транспортных средств, пешеходов и стационарных объектов. 
Затем мы рассмотрели типы датчиков и источники информации, которые предос- 
тавляют самоуправляемым автомобилям входные данные во время движения. Так- 
же мы обсудили типы вычислений, необходимых для эффективного управления 
автомобилем. Глава завершилась обзором вычислительной архитектуры автомо- 
бильного компьютера Тез|а Н\МЗ. 


Эта глава помогла вам ознакомиться с основами вычислительной архитектуры для 
самоуправляемых автомобилей и с типами датчиков, используемых такими авто- 
мобилями. Теперь вы должны разбираться в типах вычислений, применяемых в са- 
моуправляемых автомобилях, и понимать связанные с ними проблемы безопасно- 
сти. 


В следующей, заключительной главе мы обсудим перспективы развития компью- 
терных архитектур. В ней будут рассмотрены важные достижения и современные 
тенденции, которые привели к текущему состоянию компьютерных архитектур, 
а также перспективы дальнейшего развития этих тенденций для определения неко- 
торых возможных будущих технологических направлений. Также будут рассмот- 
рены потенциально прорывные технологии, которые могут изменить направление 
развития компьютерных архитектур в будущем. В заключение будут предложены 
определенные подходы к профессиональному совершенствованию архитектора 
компьютеров, которые могут помочь сформировать набор полезных для будущего 
навыков. 


Упражнения 


1. Если на вашем компьютере еще не установлен Руоп, перейдите по адресу 
№ рз://ууууму.руоп.ого/до\уюад5/ и установите текущую версию. Убедитесь, 
что файлы Ру®фоп включены в пути поиска, набрав ру&поп --\мег$1оп в командной 
строке системы. Вы должны получить ответ, подобный следующему: 
РуКоп 3.10.3. 


Установите ТепзогЕМю\/ (платформу для машинного обучения с открытым 
исходным кодом) с помощью команды (также в системной командной строке) 
рЯр 1п$%а11 +епзог1ои. Возможно, для успешной установки вам потребуется ис- 
пользовать функцию запуска от имени администратора при открытии окна ко- 
мандной строки. Установите Мафр]оИЪ (библиотеку для визуализации данных) 
с помощью команды рёр 1п%а11 тар10{116. 


2. Используя библиотеку ТепзогЕ]о\\, создайте программу, которая загружает на- 
бор данных СТЕАК-10 и отображает подмножество изображений вместе с мет- 
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ками, связанными с каждым изображением. Этот набор данных является про- 
дуктом Канадского института перспективных исследований (СапаФап 
[мзицие Юг Адуапсед Везеагсй, СТЕАК) и содержит 60 000 изображений, каждое 
из которых состоит из 32 х32 КОВ-пикселов. Эти изображения были случай- 
ным образом разделены на обучающий набор из 50 000 изображений и тесто- 
вый набор из 10 000 изображений. Каждое изображение было помечено людьми 
как представляющее предмет одной из 10 категорий: самолет, автомобиль, пти- 
ца, кошка, олень, собака, лягушка, лошадь, судно или грузовик. Для получения 
дополнительной информации о наборе данных СТЕАЕК-10 см. технический отчет 
Алекса Крижевски (А]ех Ки2ВеузКу) по адресу ВИрз://\ууу\у.сзфогош®о.еди/-Кт12/ 
1еагпто-Ёеабиге5-2009-ТВ.рдЕ. 


3. Используя библиотеку ТепзогЕ]о\, создайте программу, которая строит свер- 
точную нейросеть (СММ) на основе структуры, показанной на рис. 16.1. Приме- 
ните фильтр свертки 3 х 3 в каждом сверточном слое. Используйте 32 фильтра в 
первом сверточном слое и 64 фильтра в двух других сверточных слоях. В скры- 
том слое используйте 64 нейрона. Выделите 10 выходных нейронов, отражаю- 
щих отнесение изображения к одной из 10 категорий СЕАК-10. 


4. Используя библиотеку ТепзогЕю\и, создайте программу, которая обучает ней- 
росеть СММ, разработанную в упражнении 3, и испытайте итоговую модель с 
помощью тестовых изображений набора СТРАК-10. Определите долю правиль- 
но идентифицированных нейросетью тестовых изображений. 
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Квантовые вычисления и другие 
перспективные направления 
в вычислительных архитектурах 


В этой главе описаны дальнейшие перспективы развития компьютерных архитек- 
тур. Мы рассмотрим важные технологические достижения и современные тенден- 
ции, которые привели к текущему состоянию компьютерных архитектур. Затем мы 
попробуем экстраполировать текущие тенденции и определим некоторые возмож- 
ные направления развития вычислительных систем в будущем. Мы также рассмот- 
рим некоторые потенциально прорывные технологии, которые могут существенно 
повлиять на развитие будущих компьютерных архитектур. 


В этой главе представлены некоторые рекомендуемые подходы к профессиональ- 
ному развитию архитектора компьютеров. Следуя этим рекомендациям, вы смсже- 
те поддерживать набор навыков, который останется актуальным и совместимым с 
будущими достижениями, какими бы они ни оказались. 


Прочитав эту главу, вы познакомитесь с историей развития компьютерных архи- 
тектур, которая привела к нынешней ситуации в этой области, а также с текущими 
тенденциями в проектировании компьютеров и их возможным влиянием на буду- 
щие технологические направления. Вы получите представление о некоторых по- 
тенциально прорывных технологиях, которые могут существенно изменить компь- 
ютерные архитектуры будущего. Вы также изучите некоторые полезные методы 
для поддержания неизменно актуального набора навыков в области компьютерной 
архитектуры. 


В этой главе будут представлены следующие темы: 
» Текущее развитие компьютерных архитектур; 


» экстраполяция современных тенденций в будущее; 
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® потенциально прорывные технологии; 


» формирование набора навыков с заделом на будущее. 


Технические требования 


Файлы для этой главы, включая ответы к упражнениям, доступны По адресу 
Б@рз://овиБ.сот/РаскРи 1$ Пт2/Модегп-Сотршег-Агспесёиге-апд- 
ОграшхаНоп-Зесопд-ЕФЧ8оп. 


Текущее развитие компьютерных архитектур 


В главе [ было представлено краткое введение в историю автоматических вычисли- 
тельных устройств, от механической аналитической машины Бэббиджа до появле- 
ния архитектуры х86, которая продолжает служить основой для большинства со- 
временных персональных компьютеров. Это развитие вычислительных технологий 
опиралось на ряд новаторских технологических достижений, в первую очередь на 
изобретение транзистора и разработку процессов изготовления интегральных схем. 


За десятилетия, прошедшие с момента появления [! 4004 в 1971 г., процессоры 
значительно усложнились в части количества транзисторов и других компонентов 
схемы, интегрированных в общий кристалл. Одновременно с ростом количества 
элементов схемы в расчете на чип на несколько порядков увеличилась тактовая 
частота устройств. 


Расширение возможностей процессора и увеличение скорости выполнения инст- 
рукций привело к превращению разработки программного обеспечения в отдельную 
огромную отрасль мирового масштаба. На заре цифровых компьютеров программ- 
ное обеспечение разрабатывалось небольшими группами высококвалифицирован- 
ных специалистов в исследовательской обстановке. Сегодня мощные персональные 
компьютеры можно приобрести за вполне разумные деньги, а средства разработки 
программного обеспечения, такие как компиляторы и интерпретаторы языков про- 
граммирования, находятся в широком доступе и зачастую бесплатны. Поскольку 
возможности процессоров значительно расширились, доступность и распростра- 
ненность вычислительных ресурсов создали высокий спрос на программное обес- 
печение для работы на этих устройствах. 


В интегральную схему современного процессора заложено гораздо больше функ- 
циональных возможностей, чем в ранние устройства, такие как процессор 6502. 
6502 содержит базовый набор компонентов, необходимый для выполнения полез- 
ных вычислений: устройство управления, набор регистров, арифметико-логическое 
устройство и внешняя шина для доступа к инструкциям, данным и периферийным 
устройствам. 


Самые сложные современные процессоры, предназначенные для бизнеса и домаш- 
них пользователей, включают в себя базовую функциональность, аналогичную 
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возможностям 6502, с существенными дополнительными функциями и расшире- 
НИЯМИи: 


е ДО 16 процессорных ядер, каждое из которых поддерживает одновременную 
МНОГОПОТОЧНОСТЬ, 


» многоуровневая кеш-память инструкций и данных; 


® КеШ-Память для микроопераций, помогающая избежать задержки обработки, 
связанной с повторяющимися операциями декодирования инструкций; 


»е блок управления памятью, поддерживающий виртуальную память со стра- 
ничной организацией; 


» встроенная поддержка многоканального высокоскоростного последователь- 
ного ввода-вывода; 


» встроенный графический процессор, формирующий сигналы для цифрового 
видеовыхода; 


» поддержка запуска виртуализированных операционных систем. 


Подводя итог технологическому развитию от процессора 6502 до современного 
процессора хб4, можно сказать, что в отличие от одного 8-разрядного ядра 6502 
современные процессоры оснащаются несколькими параллельно работающими 
64-разрядными ядрами и реализуют множество дополнительных функций, разрабо- 
танных специально для увеличения скорости выполнения инструкций. 


В дополнение к высокой чистой вычислительной мощности процессоров современ- 
ных ПК набор инструкций х86/хб4 позволяет выполнять широкий спектр опера- 
ций — от простых до чрезвычайно сложных. С другой стороны, в современных 
ВТ$С-процессорах, таких как АВМ и В]$С-У, реализованы намеренно сокращен- 
ные наборы инструкций с целью разбиения сложных операций на последователь- 
ности более простых шагов, каждый из которых выполняется с очень высокой ско- 
ростью при работе в контексте более широкого набора регистров. 


Высокоуровневые конфигурации вычислительных архитектур, пожалуй, не претер- 
пели кардинальных изменений со времен процессора 6502. С каждым расширением 
набора инструкций архитектуры процессора или внедрением дополнительной тех- 
нологии кеширования эти изменения постепенно расширяли функциональность, 
доступную разработчикам программного обеспечения, или увеличивали скорость 
выполнения алгоритмов. Переход к поддержке нескольких ядер и многопоточности 
в пределах одного ядра обеспечил возможность одновременного выполнения не- 
скольких независимых потоков вместо использования принципа разделения по 
времени на одном ядре. 


Постепенный характер этого развития по большей части был преднамеренным, 
чтобы избежать внесения в процессорную архитектуру изменений, которые могли 
воспрепятствовать обратной совместимости с множеством уже разработанных опе- 
рационных систем и прикладного программного обеспечения. Конечный резуль- 
тат — серия поколений процессоров, которые постепенно становятся все быстрее и 
производительнее, но не реализуют прорывные технологии прошлого. 
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В следующем разделе мы попытаемся экстраполировать текущее состояние поко- 
ления высокопроизводительных вычислительных систем, рассмотренных в гла- 
ве 13, чтобы предсказать подвижки в области компьютерных архитектур, которые 
могут произойти в течение следующих одного-двух десятилетий. 


Экстраполяция современных тенденций 
в будущее 


Возможности процессорных технологий текущего поколения начинают упираться в 
некоторые существенные физические ограничения, которые, как мы можем ожи- 
дать, будут сдерживать темпы роста производительности в будущем. Эти ограни- 
чения, конечно, не приведут к резкой остановке прогресса в области повышения 
плотности схем и тактовой частоты. Скорее, улучшение характеристик будущих 
поколений процессоров будет происходить по направлениям, отличающимся от 
традиционных моделей роста возможностей полупроводниковых устройств. Для 
того чтобы более внимательно изучить ожидания роста производительности про- 
цессоров в будущем, мы начнем с того, что вернемся к закону Мура и рассмотрим 
его применимость к будущему полупроводниковых технологий. 


Закон Мура — новый взгляд 


Пересмотренная версия закона Мура, опубликованная Гордоном Муром в 1975 г., 
предсказывала, что количество компонентов интегральных схем в расчете на уст- 
ройство будет удваиваться примерно каждые два года. Этот закон демонстрировал 
замечательную точность прогнозирования в течение нескольких десятилетий, но по 
состоянию на 2015 г., по данным [и @|, темпы роста замедлились до удвоения при- 
мерно каждые два с половиной года. Это указывает на то, что темпы роста плотно- 
сти интегральных схем начали замедляться, но этот рост, безусловно, не прекра- 
тился и, как ожидается, не прекратится и в обозримом будущем. 


Технологии интегральных схем продолжат совершенствоваться, что обеспечит по- 
явление более высокопроизводительных устройств с большей плотностью компо- 
нентов в течение многих лет. Однако мы можем ожидать, что скорость роста плот- 
ности схем со временем начнет снижаться из-за физических ограничений, 
связанных с созданием компонентов размером порядка единиц нанометров. 


Замедление темпов роста плотности схем не означает, что эта тенденция близка к 
завершению. По состоянию на 2022 г., современные технологии массового произ- 
водства интегральных схем основаны на элементах с размерами всего около 5 нм. 
В настоящее время ведется работа по разработке следующего поколения схемотех- 
нических решений с размерами элементов 4 нм. Будущие поколения с размерами 
элементов 3 и даже 2 нм находятся на стадии планирования. 


Через какое-то время такое увеличение плотности схем, вероятно, будет реализова- 
но, но технологический прогресс сопряжен с ростом затрат и техническими про- 
блемами, которые приводят к задержкам в развертывании новых технологий на 
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производственных линиях. Самые передовые технологии производства интеграль- 
ных схем настолько дороги в разработке и сложны во внедрении, что лишь не- 
сколько крупных полупроводниковых компаний обладают финансовыми ресурсами 
и техническим опытом для внедрения таких процессов. 


Учитывая продолжающееся снижение темпов роста плотности схем, производители 
полупроводников начали уделять особое внимание альтернативным методам, по- 
зволяющим более плотно размещать компоненты на чипе. Традиционно интеграль- 
ные схемы рассматривались в основном как двумерные структуры, формируемые 
послойно следующим образом: 


» последовательное нанесение различных материалов в ходе операций маски- 
рования для создания легированных областей транзисторов, а также других 
компонентов схемы, таких как конденсаторы и диоды; 


е Нанесение токопроводящих металлизированных дорожек на элементы схемы 
в виде дополнительных слоев. 


Связь между элементами схемы при двумерной компоновке устройства предусмат- 
ривает электрическое взаимодействие между объектами, расположенными на по- 
верхности чипа на некотором расстоянии друг от друга. Чип имеет небольшие раз- 
меры, поэтому время, необходимое электрическому сигналу для прохождения 
между объектами, часто незначительно по сравнению с другими ограничениями. 


Вы можете задаться вопросом: а нельзя ли разместить элементы интегральной схе- 
мы иным способом, отличным от их распределения по плоской поверхности? Дей- 
ствительно, элементы можно укладывать на кристалле интегральной схемы друг на 
друга. Этот подход к проектированию мы рассмотрим в следующем разделе. 


Третье измерение 


Разработав методы размещения элементов друг на друге на одном кристалле инте- 
гральной схемы, производители полупроводников сделали шаг к расширению за- 
кона Мура. Одной из первых целей для многоуровневых конфигураций интеграль- 
ных схем стала вездесущая пара из и-канального и р-канального МОП- 
транзисторов, используемая в схемах КМОП. 


ше! опубликовала данные об успехах, достигнутых ее исследователями в области 
многоуровневых пар КМОП-транзисторов, в начале 2020 г. Компания не только 
продемонстрировала способность многоуровневого размещения устройств на 
кремниевом кристалле, но и показала, как использовать различные технологии из- 
готовления на каждом уровне для достижения максимальных рабочих характери- 
стик пары транзисторов. Кремниевые я-канальные транзисторы обладают хороши- 
ми рабочими характеристиками, но р-канальные транзисторы, построенные на 
кремнии, имеют относительно меньшую скорость переключения. р-Канальные 
транзисторы, реализованные с германиевым транзисторным каналом вместо крем- 
ниевого, обеспечивают повышенную скорость переключения, улучшая производи- 
тельность КМОП-пары. 
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В демонстрации интеграции устройств 1 со смешанными технологиями крем- 
ниевые и-канальные транзисторы были сформированы на базовом кремниевом кри- 
сталле с расположенными поверх них германиевыми р-канальными устройствами. 
Если этот метод можно масштабировать для поддержки производства интеграль- 
ных схем, он обещает дальнейшее увеличение плотности устройств и повышение 
тактовой частоты. 


Другой повышающий плотность подход заключается в объединении нескольких 
отдельно сконструированных кристаллов интегральных схем в вертикальный пакет 
с соединениями между слоями для питания и передачи данных. Этот подход можно 
представить, как припаивание кристаллов интегральных схем друг поверх друга. 


Отдельно изготовленные интегральные схемы, объединяемые в одном пакете, на- 
зывают чиплетами. Чиплеты можно разложить рядом друг с другом на кремниевой 
подложке или уложить друг на друга — в зависимости от требований к устройству. 
Такой подход позволяет сконструировать каждый чиплет сложного устройства с 
помощью наиболее подходящей для него технологии. Например, один способ изго- 
товления может быть оптимальным для главного процессора, в то время как другой 
процесс может лучше всего подходить для чипсета памяти, интегрированного с 
процессором. Интегрированный радиоинтерфейс сотовой связи в том же пакете 
можно сконструировать с применением еще одного процесса. 


Использование вертикального измерения при конструировании отдельных инте- 
гральных схем и сложных устройств, состоящих из нескольких чиплетов в одном 
пакете, обеспечивает более высокий уровень интеграции систем на кристалле ($оС) 
и более высокую общую производительность. Поскольку совершенствование и 
внедрение этих технологий на производственных линиях продолжается, мы можем 
ожидать, что увеличение сложности и функциональности схем, предсказанное за- 
коном Мура, продолжится и в предстоящие годы, хотя, вероятно, и с меньшими 
темпами. 


Следующая тенденция, которую мы рассмотрим, — продолжающийся рост исполь- 
зования узкоспециализированных процессорных устройств вместо процессоров 
общего назначения. 


Распространение специализированных устройств 


В предыдущих главах мы рассмотрели несколько специализированных вычисли- 
тельных технологий, нацеленных на такие области, как цифровая обработка сигна- 
лов, создание трехмерных графических изображений, майнинг биткоинов и обра- 
ботка данных с помощью нейронных сетей. Безусловно, все вычисления, 
необходимые для решения этих задач, могут производиться обычными процессо- 
рами общего назначения. Важным отличием вычислений, осуществляемых специа- 
лизированными устройствами, является повышенная скорость выполнения, причем 
пропускная способность иногда в сотни и даже тысячи раз может превысить уро- 
вень, доступный для обычного процессора. 
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Растущее значение машинного обучения и автономных технологий будет и дальше 
стимулировать инновации в компьютерных архитектурах, лежащих в основе буду- 
щих цифровых систем. По мере того как автомобили и другие сложные системы 
приобретают автономные функции, которые либо дополняют, либо заменяют 
функции, традиционно выполняемые операторами-людьми, базовые вычислитель- 
ные архитектуры продолжат развиваться, чтобы обеспечить более высокий уровень 
производительности для решения конкретных задач при минимальном энергопо- 
треблении. 


Слециализированные процессоры будут использовать преимущества достижений, 
рассмотренных ранее в этой главе, что поможет оптимизировать конструкции уст- 
ройств для конкретных областей применения. Тенденция к росту специализации 
процессоров сохранится и в ближайшие годы, по всей видимости, ускорится. 


Обсуждение в этом разделе было сосредоточено на продолжении текущих тенден- 
ций в предстоящие годы. В следующем разделе мы рассмотрим возможность появ- 
ления технологических инноваций, которые существенно изменят путь развития и 
позволят перейти от непрерывной череды постепенных улучшений компьютерной 
архитектуры к чему-то совершенно иному. 


Потенциально прорывные технологии 


До сих пор в этой главе основное внимание уделялось текущим тенденциям и воз- 
можным последствиям их дальнейшего развития в будущем. На примере ситуации 
с изобретением транзистора мы увидели, что всегда возможно появление новой 
технологии, которая радикально меняет предыдущий опыт и ведет будущее вычис- 
лительной техники в новом направлении. 


В этом разделе мы попытаемся определить некоторые потенциальные источники 
таких технологических достижений в ближайшие годы. 


Квантовая физика 


В своей аналитической машине Чарльз Бэббидж пытался довести возможности 
чисто механических вычислительных устройств до ранее недостижимого уровня. 
Его попытка, несмотря на амбициозность замысла, в конечном счете оказалась не- 
удачной. Разработке применимых на практике автоматизированных вычислитель- 
ных устройств пришлось подождать до тех пор, пока появление технологии ваку- 
умных ламп не обеспечило подходящую основу для реализации сложной цифровой 
Логики. 


Позже изобретение транзистора вывело вычислительные технологии на путь нара- 
щивания возможностей и сложности, который в конечном счете привел нас к тому 
состоянию вычислительной техники, которым мы наслаждаемся сегодня. С момен- 
та появления процессора ше! 4004 прогресс в возможностях вычислений принял 
форму постепенных улучшений того, что по сути является все той же технологией, 
положенной в основу кремниевых транзисторов. 
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Работа транзисторов основана на свойствах полупроводниковых материалов, таких 
как кремний, и применении этих свойств для реализации цифровых коммутацион- 
ных схем. Цифровые схемы, построенные на полупроводниках, обычно выполняют 
операции с использованием двоичного формата данных. Эти устройства предна- 
значены для получения надежно воспроизводимых результатов при вводе одних и 
тех же данных при последующем выполнении одной и той же последовательности 
инструкций. 


В качестве альтернативы этому подходу по всему миру проводятся многочислен- 
ные исследовательские работы, изучающие возможность использования аспектов 
квантовой физики в вычислительной технике. Квантовая физика описывает пове- 
дение материи на уровне отдельных атомов и субатомных частиц. 


Поведение частиц на субатомном уровне существенным и удивительным образом 
отличается от знакомого поведения макрообъектов, с которыми мы взаимодейству- 
ем каждый день по законам классической физики. Законы квантовой физики были 
открыты и описаны в теориях, зародившихся в середине ХХ в. 


Квантовая физика строго определяется набором теорий, которые продемонстриро- 
вали замечательную предсказательную способность. Например, Вольфганг Паули 
постулировал существование частицы нейтрино в рамках квантовой физики в 
1930 г. Нейтрино — это крошечные субатомные частицы, которые практически не 
взаимодействуют с другими частицами, что делает их обнаружение чрезвычайно 
трудным. Существование нейтрино не было доказано научными экспериментами 
до 1950-х годов. 


Несколько других типов субатомных частиц были предсказаны теорией и в конеч- 
ном счете обнаружены экспериментально. Квантовая физика, включая странное 
поведение, проявляющееся в субатомной сфере, предлагает многообещающее но- 
вое направление для компьютерных архитектур будущего. 


Изменение физических параметров, связанных с макрообъектами, например скоро- 
сти движущегося автомобиля по мере его ускорения или замедления, кажется не- 
прерывным. С другой стороны, электроны внутри атома могут существовать только 
на определенных, дискретных энергетических уровнях. Энергетический уровень 
электрона в атоме примерно соответствует скорости движения частицы по орбите 
вокруг центрального тела в классической физике. 


Электрон в атоме не может существовать в какой-либо точке между двумя энерге- 
тическими уровнями. Он всегда находится строго на том или ином энергетическом 
уровне. Дискретный характер уровней энергии привел к введению термина 
"квант" для описания таких явлений. 


Спинтроника 


Помимо энергетического уровня в атоме электроны обладают свойством, анало- 
гичным вращению объекта в классической физике. Спин элементарной атомной 
частицы представляет собой особый тип углового момента, концептуально анало- 
гичный моменту импульса вращающегося баскетбольного мяча, балансирующего 
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на кончике пальца. Как и в случае с энергетическим уровнем, это спиновое состоя- 
ние квантуется. 


Исследователи продемонстрировали способность менять и измерять спиновое по- 
ведение электронов способом, который может оказаться подходящим для практи- 
ческих цифровых коммутационных схем. Использование спина электрона в качест- 
ве компонента цифровой коммутационной схемы называют спинтроникой — это 
слово получено путем объединения терминов 5рт (вращение) и е/естотсх (элек- 
троника). Эта технология использует квантовое спиновое состояние электронов для 
хранения информации аналогично состоянию заряда конденсаторов в традицион- 
ной электронике. 


Однако есть некоторые существенные отличия спинового поведения электронов от 
вращения баскетбольных мячей. Электроны на самом деле не вращаются — скорее, 
их спиновое поведение подчиняется математическим законам углового момента в 
квантованной форме. Баскетбольный мяч можно заставить вращаться с произволь- 
но выбранной скоростью, в то время как электроны могут демонстрировать враще- 
ние только на одном дискретном, квантованном уровне. Спин элементарной части- 
цы определяется ее типом, и электроны всегда имеют спин (квантовое число), 
равный 1/2. 


Вращение баскетбольного мяча можно полностью охарактеризовать сочетанием 
скорости его вращения и направления оси, вокруг которой происходит вращение. 
Раскрученный мяч, балансирующий на кончике пальца, вращается вокруг верти- 
кальной оси. Вращательное движение мяча можно полностью описать вектором, 
направленным вдоль оси вращения (в данном случае вверх), с величиной, равной 
скорости вращения мяча. 


Электроны всегда имеют одно и то же значение спина, определяющее длину векто- 
ра углового момента, поэтому единственный способ отличить спин одного элек- 
трона от другого — по направлению вектора спина. Были разработаны практиче- 
ские устройства, которые могут обеспечить выравнивание векторов спина 
электрона в двух различных ориентациях — вверх и вниз. Сочетание значения спи- 
на 1/2 и его ориентации образует спиновое квантовое число. 


Спин электрона формирует крошечное магнитное поле. Материалы, в которых 
спины большинства электронов выровнены по направлению, создают магнитное 
поле с той же ориентацией, что и у большинства выровненных электронов. Эффект 
этого выравнивания электронов наблюдается в обычных магнитных материалах, 
таких как магниты для холодильника. 


Магнитное поле, создаваемое спином электрона, нельзя объяснить классической 
физикой. Этот тип магнетизма является исключительно эффектом квантовой физики. 


Коммутационное устройство, называемое спиновым клапаном, можно построить 
на основе канала внутри интегральной схемы, на каждой стороне которого имеется 
магнитный слой. Магнитные слои выполняют функцию затворов. Если затворы 
имеют одинаковую полярность спина (вверх или вниз), через устройство может 
протекать ток, состоящий из электронов, поляризованных по спину. Если затворы 
имеют противоположную полярность, ток блокируется. Спиновый клапан можно 
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включать и выключать, меняя полярность одного из магнитов путем подачи на него 
тока с противоположным направлением спина. 


Переключение направления спина электрона может осуществляться намного быст- 
рее и потреблять гораздо меньше энергии, чем процесс зарядки и разрядки конден- 
саторов, который лежит в основе функционирования современных цифровых уст- 
ройств, использующих технологию КМОП. 


Эта ключевая особенность позволяет рассматривать потенциал спинтроники как 
технологии, которая со временем может дополнить или заменить КМОП-схемы в 
высокопроизводительных цифровых устройствах. 


В настоящее время спинтроника — это область активных исследований. Коммерче- 
ское освоение и производство цифровых устройств, которые превосходят совре- 
менные КМОП-процессоры, вряд ли начнутся в течение ближайших нескольких 
лет, если эта технология вообще окажется жизнеспособной. 


Спинтроника полагается на законы квантовой физики для выполнения цифровой 
коммутации. Квантовые вычисления, предмет следующего раздела, напрямую ис- 
пользуют квантово-механические явления для реализации аналоговой и цифровой 
обработки. 


Квантовые вычисления 


Квантовые вычисления обещают резкое повышение скорости выполнения опреде- 
ленных классов задач. Квантовые вычисления выполняют обработку с помощью 
квантово-механических явлений и могут использовать для решения задач аналого- 
вые или цифровые подходы. 


В цифровых квантовых вычислениях для выполнения вычислительных операций 
применяют квантовые логические вентили, которые основаны на схемах, называе- 
мых квантовыми битами или кубитами. Кубиты в некотором роде аналогичны 
битам в традиционных цифровых компьютерах, но между ними есть существенные 
различия. Традиционные биты могут принимать только состояния 0 и 1. Кубит мо- 
жет находиться в квантовом состоянии 0 или 1; однако он также может существо- 
вать в суперпозиции состояний 0 и | — это означает, что у него есть некоторая ве- 
роятность появления либо 0, либо 1 при наблюдении. Принцип квантовой 
суперпозиции утверждает, что результатом сложения любых двух допустимых 
квантовых состояний будет допустимое квантовое состояние. 


Всякий раз, когда считывается значение кубита, всегда возвращается либо 0, либо 
1. Это связано со "схлопыванием" суперпозиции квантовых состояний в одно со- 
стояние. Если до считывания кубит содержал квантовое значение, соответствую- 
щее двоичному значению 0 или 1, результат операции чтения будет равен двоич- 
ному значению. Если, с другой стороны, кубит содержал суперпозицию состояний, 
значение, возвращаемое операцией чтения, будет вероятностной функцией супер- 
позиции состояний. 


Другими словами, вероятность получения 0 или 1 в результате чтения кубита зави- 
сит от характеристик его квантового состояния. Значение, возвращаемое операцией 
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чтения, будет непредсказуемым. Причина этой непредсказуемости не просто в не- 
достатке знаний; в квантовой физике частица просто не имеет определенного со- 
стояния, пока не будет проведено измерение. Это одна из нелогичных и, откровен- 
но говоря, трудно вообразимых особенностей квантовой физики. 


Состояние кубита, которое близко к двоичному значению 1, будет иметь более вы- 
сокую вероятность возвращения значения | при чтении, чем то, которое ближе к 
двоичному значению 0. Выполнение операции чтения для нескольких кубитов, ко- 
торые изначально находились в одинаковых квантовых состояниях, не всегда будет 
давать один и тот же результат из-за вероятностного характера операции чтения. 


Схемы на основе кубитов могут демонстрировать и использовать свойства кванто- 
вой запутанности — центрального принципа квантовой физики. Квантовая запу- 
танность возникает, когда несколько частиц связаны таким образом, что измерение 
одной частицы влияет на измерение связанных с ней частиц. Наиболее удивитель- 
ный аспект этой связи заключается в том, что она остается в силе даже тогда, когда 
частицы находятся на большом расстоянии друг от друга. Эффект запутанности, 
по-видимому, распространяется мгновенно, не ограничиваясь скоростью света. Та- 
кое поведение может показаться научной фантастикой, однако оно было подтвер- 
ждено экспериментально и даже использовалось в коммуникационных технологиях 
космического аппарата МАЗА Гипаг Абтозрпеге Виз апд ЕпугоптепЕ Ехрогег 
(ГАФЕЕ), который находился на орбите вокруг Луны с 2013 по 2014 г. 


Квантовые компьютеры способны использовать запутанность при обработке ин- 
формации. Если вы проработаете примеры в конце этой главы, у вас будет возмож- 
ность создать программу для квантового компьютера, демонстрирующую эффекты 
квантовой запутанности, и вы сможете запустить эту программу на реальном кван- 
товом компьютере. 


Несколько непредсказуемый характер результатов, возвращаемых при чтении ку- 
бита, по-видимому, выступает против использования этой технологии в качестве 
основы для цифровой вычислительной системы. Эта частичная непредсказуе- 
мость — одна из причин, по которой квантовые компьютеры считаются полезными 
только для определенных классов задач. Большинству клиентов не понравится, ес- 
ли банк будет использовать компьютер, который каждый раз вычисляет разные ос- 
татки на счетах из-за квантовой неопределенности. 


В следующих разделах описаны две ключевые категории областей применения, 
которые в настоящее время рассматриваются для квантовых компьютеров. 


Квантовый взлом кода 


Квантовый взлом кода использует методы цифровых квантовых вычислений для 
взлома современных криптографических кодов. Многие применяемые сегодня 
криптографические алгоритмы основаны на предположении, что с вычислительной 
точки зрения определение множителей большого числа (содержащего, возможно, 
сотни десятичных цифр), являющегося произведением двух больших простых чи- 
сел, — невыполнимая задача. Нельзя ожидать, что разложение на множители тако- 
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го числа на современных компьютерах или даже на суперкомпьютере или тысячах 
процессоров, работающих параллельно в облачной среде, даст правильный резуль- 
тат за разумный период времени. 


Алгоритм Шора, разработанный Питером Шором (Рег Зпог) в 1994 г., описывает 
действия, которые должен выполнить квантовый компьютер, чтобы определить 
простые множители данного числа. Квантовый компьютер, использующий алго- 
ритм Шора, потенциально способен разложить очень большое число на множители 
гораздо быстрее, чем обычные компьютеры, тем самым делая современные крипто- 
графические системы, основанные на криптографии с открытым ключом, уязвимы- 
ми для таких атак. На сегодняшний день из-за ограниченного количества кубитов в 
квантовых компьютерах квантовые вычисления продемонстрировали только спо- 
собность определять множители относительно небольших чисел, таких как 21, но 
потенциальную угрозу признают организации и правительства, которым требуется 
высокий уровень безопасности связи. В будущем могут появиться системы кванто- 
вых вычислений, способные взламывать коды, которые мы используем сегодня для 
защиты веб-сайтов и онлайн-банкинга. 


Однако нет особых причин беспокоиться о надежности вашего банковского счета в 
связи с угрозой квантовых атак. В стадии разработки уже находится множество ал- 
горитмов шифрования с открытым ключом, устойчивых к взлому с применением 
квантовых вычислений. В совокупности эти алгоритмы называются посткванто- 
вой криптографией. В случае если квантовая угроза современным методам крип- 
тографии станет реальной, можно ожидать масштабного перехода к квантово- 
устойчивым криптографическим алгоритмам. 


Алдиабатические квантовые вычисления 


Адиабатические квантовые вычисления — это подход к аналоговым квантовым 
вычислениям, который обещает эффективное решение широкого круга практиче- 
ских задач оптимизации. Представьте, что вы находитесь в холмистой местности на 
прямоугольном участке, огражденном забором. Вам нужно найти самую низкую 
точку в пределах огороженной области. В этом сценарии стоит сильный туман, 
и вы не можете видеть окружающую местность. Единственная подсказка, которая у 
вас есть, — это наклон поверхности под вашими ногами. Вы можете идти вниз по 
склону, но при достижении ровного участка вы не можете быть уверены в том, где 
находитесь, — в местной котловине или действительно нашли самую низкую точку 
во всей огражденной области. 


Это пример простой задачи двумерной оптимизации. Цель состоит в том, чтобы 
найти в заданной области координаты х и у точки с наименьшей высотой, называе- 
мой глобальным минимумом, не блуждая и не застревая во впадине на большей 
высоте, называемой локальным минимумом. 


Для того чтобы найти самую низкую точку в холмистой местности, не требуется за- 
действовать нечто столь замысловатое, как квантовые вычисления, но многие реаль- 
ные задачи оптимизации имеют значительно большее количество входных перемен- 
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ных, например от 20 до 30, которые необходимо менять при поиске глобального ми- 
нимума. Вычислительная мощность, необходимая для решения таких задач, выходит 
за рамки возможностей даже самых быстрых современных суперкомпьютеров. 


Подход квантовых вычислений к решению таких проблем начинается с создания 
конфигурации кубитов, содержащей суперпозицию всех возможных решений про- 
блемы, и последующего медленного уменьшения эффекта суперпозиции. 


Ограничивая состояние конфигурации квантовой схемы во время этого процесса, 
можно гарантировать, что решение, которое останется после устранения суперпо- 
зиции и определения дискретных значений 0 или 1 для всех кубитов, является гло- 
бальным минимумом. 


Термин "адиабатический" в названии этого метода ссылается на аналогию между 
процессом исключения суперпозиции и термодинамической системой, которая при 
работе не теряет и не набирает тепло. 


Адиабатическая квантовая оптимизация — это область интенсивных исследований. 
Еще предстоит выяснить, какой уровень возможностей эта технология способна 
привнести в решение сложных задач оптимизации. 


Будущее квантовых вычислений 


Термин "квантовое превосходство" описывает переходную точку, в которой 
квантовые вычисления превосходят возможности традиционных цифровых вычис- 
лений в конкретной проблемной области. Среди исследователей ведутся оживлен- 
ные дебаты о том, было ли уже достигнуто квантовое превосходство какой-либо из 
крупных организаций, разрабатывающих технологии квантовых вычислений, когда 
эта точка может быть достигнута и может ли такой переход вообще когда-либо 
произойти. 


Ряд существенных препятствий стоит на пути широкого внедрения квантовых вы- 
числений способом, аналогичным повсеместному использованию вычислительных 
устройств на основе КМОП по всему миру сегодня. Вот некоторые из наиболее ак- 
туальных проблем, требующих решения: 


е увеличение количества кубитов в компьютере для поддержки решения круп- 
ных и сложных задач, 


» реализация возможности инициализировать кубиты произвольными значе- 
ниями; 


е предоставление механизмов для надежного считывания состояния кубитов; 


е Признание, что компоненты, необходимые для квантовых компьютеров, 
сложны в производстве и очень дороги, 


» устранение эффектов квантовой декогеренции. 


Термин "квантовая декогеренция" относится к потере фазовой когерентности в 
квантовой системе. Для того чтобы квантовый компьютер функционировал долж- 
ным образом, внутри системы должна поддерживаться фазовая когерентность. 
Квантовая декогеренция возникает в результате вмешательства внешних факторов 
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во внутреннюю работу квантовой системы или в результате помех, генерируемых 
внутри системы. Квантовая система, которая остается совершенно изолированной, 
может поддерживать фазовую когерентность неограниченно долго. Нарушение ра- 
боты системы, например, путем считывания ее состояния нарушает когерентность 
и может привести к декогеренции. Процесс контроля и корректировки эффектов 
декогеренции называют коррекцией квантовых ошибок. 


Эффективное управление декогеренцией — одна из самых больших проблем в 
квантовых вычислениях. 


Конструкции современных квантовых компьютеров основаны на экзотических мате- 
риалах, таких как гелий-3, который нарабатывается в ядерных реакторах, и для них 
требуются сверхпроводящие кабели с нулевым сопротивлением. Во время работы 
системы квантовых вычислений должны охлаждаться до температур, близких к аб- 
солютному нулю. Современные квантовые компьютеры в основном представляют 
собой лабораторные системы, и для их создания и эксплуатации требуется специаль- 
но выделенная группа экспертов. Эта ситуация в чем-то аналогична ранним дням 
компьютеров на базе вакуумных ламп. Одно из главных отличий от времен вакуум- 
ных ламп заключается в том, что сегодня у нас есть Интернет, который предоставля- 
ет обычным пользователям доступ к возможностям квантовых вычислений. 


Современные системы квантовых вычислений содержат не более одной-двух сотен 
кубитов и доступны по большей части коммерческим, академическим и правитель- 
ственным организациям, которые финансируют их разработку. Однако существуют 
некоторые уникальные возможности получения доступа к реальным квантовым 
компьютерам для студентов и обычных людей. 


Одним из примеров является ВМ Опапат: В@р$://Лу\у\ т.сот/дцатит- 
сотрийп?2/. С помощью этих бесплатных ресурсов компания ВМ предоставляет 
набор инструментов, включая среду разработки квантовых алгоритмов под назва- 
нием @©15Кеь доступную по адресу ВИрз://му\у\. 915 КИ.огР/. Используя инструменты 
О15Кеь разработчики могут научиться создавать квантовые алгоритмы и даже от- 
правлять программы для выполнения в пакетном режиме на реальный квантовый 
компьютер. Упражнения в конце этой главы описывают действия, которые следует 
предпринять, чтобы начать работу в этой области. 


Квантовые вычисления демонстрируют значительные перспективы для решения 
определенных категорий задач, хотя широкая коммерциализация этой технологии, 
судя по всему, произойдет не ранее, чем через несколько лет. 


Следующая технология, которую мы рассмотрим, — это углеродные нанотрубки, 
которые потенциально могут хотя бы частично отодвинуть цифровую обработку от 
мира кремния. 


Углеродные нанотрубки 


Полевой транзистор на углеродных нанотрубках (сатгфоп папошфе Не!4-еНес 
{гап$1$0г, СМТЕЕТ) — это транзистор, который в качестве канала затвора использу- 
ет одну углеродную нанотрубку либо массив таких нанотрубок вместо кремниевого 
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канала традиционного полевого МОП-транзистора. Углеродная нанотрубка — это 
составленная из атомов углерода трубчатая структура диаметром приблизительно 
1 нм. 


Углеродные нанотрубки являются исключительно хорошими электрическими про- 
водниками, обладают высокой прочностью на растяжение и очень хорошо прово- 
дят тепло. Углеродная нанотрубка может выдерживать плотность тока более чем 
в 1000 раз большую, чем такие металлы, как медь. В отличие от металлов, электри- 
ческий ток может распространяться только вдоль оси нанотрубки. 


Ниже перечислены преимущества транзисторов СМТЕЕТ по сравнению с полевыми 
МОП-транзисторами. 


» Более высокий управляющий ток. 
» Существенно меньшая рассеиваемая мощность. 
» Устойчивость к высоким температурам. 


»® Превосходное рассеивание тепла, обеспечивающее высокую плотность раз- 
мещения устройств. 


» Рабочие характеристики я- и р-канальных устройств СМТЕЕТ полностью 
совпадают. С другой стороны, в КМОП-устройствах характеристики и- и 
р-канальных транзисторов могут существенно различаться. Это ограничивает 
общие рабочие характеристики схемы возможностями устройства с наихуд- 
шими рабочими характеристиками. 


Как и в случае с другими новыми технологиями, обсуждаемыми в этой главе, тех- 
нология СМТЕЕТ сталкивается с некоторыми существенными препятствиями на 
пути коммерциализации и широкого применения. 


е Изготовление СМТЕЕТ-транзисторов чрезвычайно сложно из-за необходимо- 
сти укладывать и перемещать трубки нанометрового размера. 


» Производство нанотрубок, необходимых для СМТЕЕТ-транзисторов, также 
очень сложный процесс. Нанотрубки можно рассматривать как листы угле- 
родной ткани, которые необходимо свернуть в трубки вдоль определенной 
оси, чтобы получить материал с желаемыми полупроводниковыми свойствами. 


» Углеродные нанотрубки быстро разлагаются под воздействием кислорода. 
Технологии изготовления должны учитывать это ограничение, чтобы обеспе- 
чить долговечность и надежность получаемой схемы. 


Учитывая сложность массового производства СМТЕЕТ-транзисторов, скорее всего, 
пройдет несколько лет, прежде чем в коммерческих устройствах начнут широко 
применяться транзисторы на основе углеродных нанотрубок, если это вообще про- 
изойдет. 


В предыдущих разделах были рассмотрены некоторые передовые технологии 
(спинтроника, квантовые вычисления и транзисторы на основе углеродных нанот- 
рубок) как перспективные области, которые могут внести существенный вклад в 
будущее вычислительной техники. На момент написания текста ни одна из этих 
технологий не использовалась в широких масштабах, но исследования показали 
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многообещающие результаты, и многие правительственные, университетские и 
коммерческие лаборатории усердно работают над развитием этих технологий и по- 
иском путей их применения в вычислительных устройствах будущего. 


Помимо таких широко обсуждаемых технологий, которые, судя по всему, развива- 
ются по предсказуемому хотя бы отчасти пути, всегда существует вероятность то- 
го, что какая-либо организация или частное лицо объявит о непредвиденном техно- 
логическом прорыве. Это может произойти в любой момент, и такое событие 
может перевернуть общепринятые представления о предполагаемом пути развития 
компьютерных технологий в будущем. Только время покажет. 


В контексте неопределенности будущего вычислительных архитектур профессио- 
налу в этой области целесообразно разработать стратегию, которая обеспечит по- 
стоянную актуальность его знаний независимо от того, по какому пути будут раз- 
виваться будущие технологии. В следующем разделе представлены некоторые 
рекомендации насчет того, как поддерживать свою компетентность в области тех- 
нологических достижений. 


Формирование набора навыков 
с заделом на будущее 


Учитывая технологические изменения, которые положили начало эре цифровых 
вычислений на основе транзисторов, и возможность подобных событий в будущем, 
для профессионалов в области архитектуры компьютеров важно идти в ноту с те- 
кущими достижениями и развивать интуицию относительно вероятных направле- 
ний, в которых эти технологии будут развиваться. В данном разделе представлены 
некоторые практические рекомендации, которые помогут вам быть в курсе послед- 
них достижений в области компьютерных технологий. 


Непрерывное обучение 


Специалисты по компьютерной архитектуре должны принять идею о том, что тех- 
нологии продолжают быстро развиваться, и профессионалы должны постоянно 
прилагать значительные усилия для отслеживания достижений и учета новых раз- 
работок в своей повседневной работе и решениях по планированию профессио- 
нального роста. 


Предусмотрительный профессионал полагается на широкий спектр источников 
информации, чтобы наблюдать за разработками перспективных технологий и 
оценивать их влияние на карьерные цели. Некоторые источники информации, та- 
кие как традиционные новостные сводки, можно просмотреть достаточно быстро, 
усвоив полезные сведения. Другие источники, к примеру научная литература и 
веб-сайты, курируемые экспертами в конкретных технологиях, требуют времени 
для изучения сложной технической информации. Более продвинутые темы, такие 
как квантовые вычисления, могут потребовать углубленного изучения только для 
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того, чтобы понять основы и оценить возможные варианты применения соответ- 
ствующей технологии. 


Даже при четком понимании конкретной технологии может быть сложно или даже 
невозможно точно предсказать ее влияние на отрасль и способы ее интеграции в 
архитектуры вычислительных систем, используемых коммерческими предприятия- 
ми, государственными учреждениями и широкой публикой. 


Практичный и простой в реализации подход к сбору информации состоит в том, 
чтобы выделить набор надежных источников общих и технических новостей и по- 
стоянно контролировать публикуемую в них информацию. Основные СМИ, вклю- 
чая телевизионные новости, газеты, журналы и веб-сайты, часто публикуют ин- 
формацию о многообещающих технологических разработках и влиянии цифровых 
устройств на общество во всем мире. Помимо обсуждения чисто технических ас- 
пектов вычислительных систем (до некоторой степени), эти источники предостав- 
ляют сведения о влиянии вычислительных технологий на общество, например опа- 
сения по поводу их использования для государственной и корпоративной слежки 
или распространения дезинформации. 


Технические веб-сайты, контролируемые исследовательскими организациями, от- 
дельными экспертами в области технологий и энтузиастами-любителями, предла- 
гают огромное количество информации, связанной с достижениями в области ком- 
пьютерной архитектуры. Как и в случае со всей информацией в Интернете, 
рекомендуется учитывать надежность источника всякий раз, когда вы сталкивае- 
тесь с неожиданной информацией. Ведется множество оживленных дискуссий об 
эффективности отдельных технологий, находящихся на ранних стадиях развития, 
однако есть также некоторые люди, которые выражают несогласие с опубликован- 
ной информацией просто ради спора. В конечном счете вам решать, насколько 
можно доверять любым мнениям, представленным на веб-странице. 


Ситуация в области источников технологических новостей постоянно меняется, и у 
каждого человека свои предпочтения. Тем не менее в следующем списке приведе- 
ны некоторые достаточно надежные источники новостей о компьютерных техноло- 
гиях, указанные без особого порядка. 


е ИЫр$:/ЛМесйсгипсв.сот/. ТесЮСгапсЬ сообщает о коммерческих новостях в 
области высоких технологий. 


» ИИрз://уууууу.мгед.сош/. У/ед — это ежемесячный журнал и веб-сайт, по- 
священный тому, как новые технологии влияют на культуру, экономику и 
политику. 


е ИИрз://агуесвиса.сот/. Издание Агз Тесбтса, основанное в 1998 г., публи- 
кует информацию, предназначенную для профессионалов в области инфор- 
мационных технологий. 


» Ирз://мууум Яотзпагаутаге.сот/. Топ’; Наг4\аге предлагает новости, статьи, 
сравнение цен и обзоры компьютерного оборудования и высокотехнологич- 
ных устройств. 
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» Н@рз://муууу.епрадое(.сот/. Технологический блог ЕпраДреь созданный в 
2004 г., освещает вопросы, входящие в сферу игр, технологий и развлечений. 


» Ир5://217тодо.сот/. С17т04о уделяет особое внимание разработкам, техно- 
логиям и научной фантастике. Лозунг сайта — "Мы пришли из будущего". 


» И@рз://4ПепехбуеЪ.сот/. Проект ТМ\У/ был запущен в 2006 г. с целью поде- 
литься с общественностью пониманием и представлениями о мире технологий. 


Этот список, хотя и далеко не полный, может послужить отправной точкой для 
сбора информации о текущем состоянии и ближайшем будущем вычислительных 
технологий и их применении. 


Информация из Интернета, если подходить к ней с достаточно скептической точки 
зрения, может предоставлять актуальные и точные сведения о состоянии достиже- 
ний в области компьютерной архитектуры. Однако информация, полученная таким 
образом, не дает образования в том строгом смысле, который характерен для фор- 
мального обучения, и не является публичной декларацией того, что вы усвоили эту 
информацию и способны применять ее в профессиональном контексте. 


Диплом о высшем образовании, о котором пойдет речь в следующем разделе, дает 
основательную подготовку по дисциплине и обычно принимается потенциальными 
работодателями и клиентами как свидетельство приобретения профессиональных 
навыков. 


Высшее образование 


Если прошло несколько лет с тех пор, как вы в последний раз посещали учебное 
заведение, или если вы начали свою карьеру без высшего образования, возможно, 
пришло время рассмотреть вопрос о его получении. Если даже мысль о том, чтобы 
предпринять подобное, кажется вам невозможной из-за работы или семейных об- 
стоятельств, следует учесть, что многие аккредитованные учебные заведения, 
предлагающие отличные программы обучения в областях, непосредственно связан- 
ных с архитектурой компьютеров, предоставляют возможность полноценного обу- 
чения через Интернет. Онлайн-обучение в сочетании с очной сдачей экзаменов дает 
возможность получить степень бакалавра или магистра по техническим дисципли- 
нам в ряде самых авторитетных университетов мира. 


В случае работников с образованием, проработавших несколько лет, — технологии 
и аналитические методы, которые они изучали в своем учебном заведении, могли в 
какой-то степени устареть. Для того чтобы восстановить актуальность знаний и 
поддержать компетентность в области передовых технологий, связанных с проек- 
тированием и производством современных компьютерных систем, лучшим подхо- 
дом может быть возвращение в аудиторию для более подробного ознакомления с 
техническими достижениями, которые произошли за прошедшие годы. 


Если вы не готовы к участию в программе очного обучения, многие учебные заве- 
дения предлагают онлайн-курсы, предусматривающие выдачу сертификата в такой 
предметной области, как разработка или производство компьютерного оборудова- 
ния. Несмотря на меньшую авторитетность по сравнению со степенью бакалавра 
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или магистра, прохождение программы технологической сертификации все же де- 
монстрирует определенный уровень образования и знаний в предметной области. 


Для прохождения курсов потребуются некоторые расходы на плату за обучение и 
учебники независимо от того, проводится обучение очно или через Интернет. Не- 
которые работодатели готовы предоставить частичное или полное финансирование 
участия своих сотрудников в аккредитованных программах обучения. Это финан- 
сирование может сопровождаться обязательством студента продолжать работу у 
работодателя в течение определенного периода времени после завершения обуче- 
ния. Студенты должны внимательно изучить и понять любые обязательства, кото- 
рые они могут взять на себя, если обстоятельства потребуют от них ухода из учеб- 
ного заведения или увольнения из компании-работодателя. 


Информацию о программах онлайн-обучения для получения высшего образования 
или сертификатов, которые соответствуют вашим потребностям, можно найти на 
множестве веб-сайтов. Вот некоторые примеры для США: 


® Ирз://\у\у у. изпеуу$.сот/едисаНоп/опИпе-едисайоп: по этому адресу 1.5. 
М№ 5 & \опА Кероц публикует ежегодные рейтинги аккредитованных кол- 
леджей, включая, в том числе, онлайн-программы; 


® ИИр$://мууууу. опИпец.сот/: на веб-сайте ОпПпеЦ представлены отзывы сту- 
дентов, проходящих онлайн-обучение в сотнях колледжей. 


Стараясь не наскучить вам своими предупреждениями, напомню, что вам следует 
внимательно изучить любую информацию, почерпнутую из Интернета относитель- 
но онлайн-обучения. Убедитесь, что любое рассматриваемое учебное заведение 
имеет надлежащую аккредитацию, а присуждаемые им степени принимают и ценят 
работодатели. 


Те, у кого есть необходимые ресурсы или поддержка со стороны работодателя, мо- 
гут даже рассмотреть возможность очной формы обучения на время прохождения 
программы. Работодатели, которые платят за обучение своих сотрудников, как пра- 
вило, ожидают, что студент согласится принять на себя некоторые обязательства 
перед организацией после прохождения учебной программы. Такой подход может 
обеспечить самый быстрый путь к получению диплома и, во многих случаях, от- 
крывает возможности участия в исследованиях самых передовых компьютерных 
технологий, находящихся в стадии разработки. 


Высшее образование в уважаемом учебном заведении и в соответствующей облас- 
ти обучения является "золотым стандартом", востребованным работодателями и 
признаваемым коллегами, но быть в курсе последних исследований можно также 
посредством участия в конференциях и чтения научной литературы. Такие возмож- 
ности обучения представлены в следующем разделе. 


Конференции и литература 


Для профессионалов, заинтересованных в том, чтобы быть в курсе передовых ис- 
следований в области технологий, связанных с компьютерными архитектурами бу- 
дущего, возможно, нет лучшего способа, чем узнать о последних разработках от 
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самих исследователей. По всему миру регулярно проводятся конференции по лю- 
бым темам, связанным с передовыми вычислительными технологиями, которые вы 
только можете себе представить. Например, список проводимых по всему миру 
конференций на тему квантового поведения, включая многие мероприятия, 
посвященные аспектам квантовых вычислений, доступен по адресу 
В р://диапит ш{о/соп /тдех.В ат. 


Как и в случае с другой информацией из Интернета, полезно относиться к любой 
незнакомой конференции с некоторой долей скептицизма, пока вы ее тщательно не 
проверите. К сожалению, существует явление, известное как мусорные конферен- 
ции, когда своекорыстные отдельные лица или организации проводят конференции 
с целью получения дохода, а не для обмена научными знаниями. Убедитесь, что 
любая конференция, на которую вы регистрируетесь и которую собираетесь посе- 
тить, контролируется авторитетной организацией и содержит презентации закон- 
ных исследователей в предметных областях, имеющих отношение к конференции. 


Существует большое разнообразие научной литературы, связанной с текущими 
достижениями в технологиях по компьютерной архитектуре. Профессиональные 
организации, такие как ТЕЕЕ, публикуют многочисленные научные журналы, по- 
священные передовым достижениям современных исследований. Эти журналы 
предназначены для прямого общения между исследователями, поэтому уровень 
технических знаний, ожидаемый от читателей, довольно высок. Если у вас есть не- 
обходимая подготовка и вы готовы анализировать подробности в статьях, публи- 
куемых в научных журналах, можете читать эти публикации, чтобы поддерживать 
уровень своих знаний наравне с учеными и инженерами, разрабатывающими вы- 
числительные технологии следующего поколения. 


Резюме 


Давайте кратко рассмотрим темы, которые мы обсуждали и о которых узнали в 
главах этой книги. 


» В главе 1[ "Введение в архитектуру компьютеров" мы начали с самого ранне- 
го проекта автоматической вычислительной машины — аналитической ма- 
шины Бэббиджа — и проследили историю развития цифровых компьютеров 
от самых ранних вычислительных устройств на базе вакуумных ламп до пер- 
вых поколений процессоров. Мы также ознакомились с архитектурой ранне- 
го, но все еще распространенного микропроцессора — 6502. 


» В главе 2 "Цифровая логика" мы изучили основы транзисторных технологий, 
цифровой логики, регистров и последовательностной логики. Мы также об- 
судили использование языков описания аппаратных средств при разработке 
сложных цифровых устройств. 


» В главе 3 "Элементы процессора" были рассмотрены основные компоненты 
процессоров, включая устройство управления, арифметико-логическое уст- 
ройство и набор регистров. В этой главе были представлены концепции, свя- 
занные с набором инструкций процессора, включая. подробную информацию 
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о режимах адресации, категориях инструкций, обработке прерываний и опе- 
рациях ввода-вывода процессора 6502. 


»е В главе 4 "Компоненты компьютерных систем" был представлен полевой 
МОП-транзистор и описано его использование в схемах динамической памя- 
ти ОКАМ. Кроме того, в этой главе рассматривались подсистемы обработки 
и связи современных компьютеров, включая подсистему ввода-вывода, гра- 
фические дисплеи, сетевой интерфейс и интерфейсы для клавиатуры и мыши. 


» В главе 5 "Аппаратно-программный интерфейс” мы узнали о внутреннем 
устройстве драйверов и о том, как встроенное программное обеспечение 
ВО$ оригинального ПК было заменено ЧЕЕГ в современных компьютерах. 
В этой главе были описаны процесс загрузки и концепции, связанные с про- 
цессами и потоками в современных операционных системах. 


» Глава б "Спиециализированные вычисления" представила уникальные возмож- 
ности вычислений в реальном времени, цифровой обработки сигналов и об- 
работки в графическом процессоре. Были описаны примеры специализиро- 
ванных вычислительных архитектур, основанных на этих возможностях 
обработки, включая облачные серверы, настольные компьютеры для бизнеса 
и высокопроизводительные игровые компьютеры. 


» Глава 7 "Архитектура процессора и памяти" была посвящена уникальным 
особенностям фон-неймановской, гарвардской и модифицированной гарвард- 
ской архитектур. В этой главе было описано различие между физической и 
виртуальной памятью и представлена архитектура виртуальной памяти со 
страничной организацией, включая функции блока управления памятью. 


»® В главе 8 "Методы повышения производительности" мы узнали о множестве 
методов, используемых в современных процессорах для повышения скорости 
выполнения инструкций. Рассматривались такие темы, как кеш-память, кон- 
вейерная обработка инструкций, суперскалярная обработка, одновременная 
многопоточность и обработка по принципу "одна инструкция, множество 
данных" (5ПМО). 


»е В главе 9 "Специализированные расширения процессоров" был рассмотрен 
ряд дополнительных возможностей процессора, включая привилегированные 
режимы выполнения, арифметику с плавающей запятой, управление питани- 
ем и управление безопасностью системы. 


»® В главе 10 "Современные архитектуры и наборы инструкций процессоров" 
мы углубились в детали архитектур и наборов инструкций наиболее распро- 
страненных 32-разрядных и 64-разрядных процессоров. Для каждой процес- 
сорной архитектуры — х86, хб4, 32-разрядных и 64-разрядных процессоров 
АКМ — в главе были представлены набор регистров, режимы адресации и 
категории команд, а также короткая, но функциональная программа на языке 
ассемблера. 


»® В главе 11 "Архитектура и набор инструкции Е15С-У" мы подробно рассмот- 
рели особенности архитектуры В$С-У. В этой главе была представлена ба- 
зовая 32-разрядная архитектура, включая набор регистров, набор инструкций 
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и стандартные расширения к набору инструкций. Дополнительные темы 
включали рассмотрение 64-разрядной версии архитектуры и стандартных 
конфигураций, доступных в качестве процессоров ВТ$С-У, выпускаемых се- 
рийно. Здесь было приведено несколько простых программ на языке ассемб- 
лера ВТ$С-У и даны рекомендации по реализации процессора В1ЗС-У на ос- 
нове недорогой программируемой логической интегральной схемы (ПЛИС). 


В главе 12 "Виртуализация процессоров" были представлены концепции, свя- 
занные с виртуализацией процессоров, включая проблемы, которые должны 
преодолевать средства виртуализации. Были обсуждены методы, используе- 
мые для внедрения виртуализации в современных семействах процессоров, 
включая х86, АКМ и В!$С-У. Было описано несколько популярных инстру- 
ментов виртуализации, и представлены подходы к виртуализации, исполь- 
зуемые в средах облачных вычислений. 


В главе 13 "Специализированные компьютерные архитектуры" мы ознако- 
мились с примерами некоторых конкретных компьютерных архитектур, 
включая смартфоны, персональные компьютеры, облачные вычислительные 
среды уровня центра обработки данных и нейронные сети. Были рассмотрены 
уникальные требования к обработке, связанные с каждой из этих архитектур, 
и обсуждался подбор аппаратных средств процессоров для достижения опти- 
мального компромисса между стоимостью, производительностью и энерго- 
потреблением в каждом конкретном случае. 


В главе 14 "Архитектуры для обеспечения кибербезопасности и конфиденци- 
альности вычислений" были представлены вычислительные архитектуры, 
подходящие для областей применения, где требуются исключительные га- 
рантии безопасности. Столь высокий уровень защиты необходим в критиче- 
ски важных областях, включая системы национальной безопасности и обра- 
ботку финансовых транзакций. Эти системы должны быть устойчивы к 
широкому спектру угроз кибербезопасности, в том числе к проникновению 
вредоносного кода, атакам через скрытые каналы и путем физического дос- 
тупа к аппаратным средствам компьютеров. 


Глава 15 "Архитектуры блокчейна и майнинга биткоинов" начинается с 
краткого введения в концепции, связанные с блокчейном, открытым, крипто- 
графически защищенным реестром, содержащим последовательность тран- 
закций. Далее последовал обзор процесса майнинга биткоинов, который до- 
бавляет транзакции в блокчейн Висош и вознаграждает тех, кто выполняет 
эту задачу, оплатой в биткоинах. Для майнинга биткоинов требуется высоко- 
производительное вычислительное оборудование, которое было представле- 
но с точки зрения компьютерной архитектуры для майнинга биткоинов те- 
кущего поколения. 


В главе 16 "Архитектуры для самоуправляемых автомобилей" были пред- 
ставлены возможности, которые должны быть реализованы в вычислитель- 
ных архитектурах самоуправляемых автомобилей. Глава началась с обсужде- 
ния требований по обеспечению безопасности самоуправляемого автомобиля 
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и его пассажиров, а также других транспортных средств, пешеходов и ста- 
ционарных объектов. Затем мы рассмотрели типы датчиков и источники ин- 
формации, которые предоставляют самоуправляемым автомобилям входные 
данные во время движения. После этого было приведено описание типов вы- 
числений, необходимых для эффективного управления автомобилем. Глава 
завершилась обзором примера архитектуры компьютера для самоуправляе- 
мого автомобиля. 


В этой главе мы попытались получить некоторое представление о будущем компь- 
ютерных архитектур. Мы рассмотрели основные достижения и современные тен- 
денции, которые привели к текущей ситуации в области проектирования компью- 
теров, и попытались экстраполировать их, чтобы определить направления, в кото- 
рых архитектуры вычислительных систем могут развиваться в будущем. Мы также 
обсудили некоторые потенциально прорывные технологии, способные существен- 
но повлиять на пути развития будущих компьютерных архитектур. Вам по силам 
заглянуть в будущее — выполнив упражнения в конце этой главы, вы сможете раз- 
работать алгоритм квантовых вычислений и запустить его на реальном квантовом 
компьютере бесплатно! 


В этой главе также были рассмотрены некоторые рекомендуемые подходы к про- 
фессиональному развитию архитектора компьютеров, способствующие формиро- 
ванию набора навыков, который останется актуальным и совместимым с будущими 
достижениями, какими бы они ни оказались. 


Прочитав эту главу и эту книгу, вы ознакомились с историей развития компьютер- 
ных архитектур с самых первых дней до их текущего состояния, а также с текущи- 
ми тенденциями в разработке компьютерных архитектур, которые могут указать 
будущие технологические направления. 


Вы также получили представление о некоторых потенциально прорывных техноло- 
гиях, которые могут существенно изменить архитектуру компьютеров в ближай- 
шем будущем. Наконец, в этой главе были предложены некоторые полезные мето- 
ды для поддержания неизменно актуального набора навыков в области 
компьютерной архитектуры. 


Итак, мы подошли к концу книги. Я надеюсь, что вы получили удовольствие от ее 
прочтения и выполнения упражнений — так же, как я, когда писал ее и выполнял 
эти упражнения сам. 


Упражнения 


1. Установите платформу разработки программного обеспечения для квантовых 
процессоров О15КИ, следуя указаниям по адресу: ИИ р5:// 41$ КИ.ого/доситепёаНоп/ 
гетр_5{агбед.Вит1. Эти указания предполагают установку набора инструмен- 
тов для обработки данных и машинного обучения  Апасопда 
(Вёр$://\у\у\.апасопда.сот/). После установки пакета Апасопда создайте вир- 
туальную среду Сопда с именем д15Ке*епу, где будет проходить ваша работа над 
квантовым кодом, и установите (©1$Кеё в этой среде с помощью команды рёр 
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11$4а11 415К1*. Убедитесь, что вы установили дополнительные зависимости ви- 
зуализации с помощью команды р1р 1п$6а 1 41$К1{-Фегга[\1$ца112а*1оп]. 


2. Создайте бесплатную учетную запись [ВМ Опатит по адресу В@р5://диатвит- 
сотрийп?.Шфт.сот/. Найдите свой токен для ВМ Оцапвит Зегу1сез АР] на веб- 
сайте И рз://дацапит-сотрийптр.Бт.сот/ассоииЕ и установите его в свою ло- 
кальную среду, используя указания по адресу №@рз://913КИ.огР/доситетавоп/ 
уаЫе/0.24/Л па П.В т]. 


3. Рассмотрите пример квантовой программы на веб-сайте № рз://91$КИ.ого/ 
доситешайНоп иона 5 /стгси 5/1 _ре{Япто_$аед_уИВ_95 К.В! В этом 
примере создается квантовая схема, содержащая три кубита, которая реализует 
состояние Гринбергера — Хорна — Цайлингера (ГХЦ — Огеепбегрег — 
Ногпе — ХеШпрег, СН7). Состояние ГХЦ проявляет ключевые свойства кванто- 
вой запутанности. Выполните код в среде моделирования на своем компьютере. 


4. Выполните код из упражнения 3 на квантовом компьютере [ВМ. 


Приложение 
Ответы к упражнениям 


Глава 1. Введение в архитектуру компьютеров 


Упражнение 1 


Используя свой любимый язык программирования, разработайте модель однораз- 
рядного десятичного сумматора, который работает так же, как сумматор аналити- 
ческой машины Бэббиджа. Сначала запросите у пользователя две цифры в диапазо- 
не 0-9: слагаемое и аккумулятор. Отобразите слагаемое, аккумулятор и признак 
переноса, который изначально равен нулю. Выполните серию циклов следующим 
образом: 

1) если слагаемое равно 0, выведите на экран значения слагаемого, аккумулято- 

ра и признака переноса, после чего завершите программу; 


2) уменьшите слагаемое на | и увеличьте значение аккумулятора на 1; 


3) если значение аккумулятора увеличивается с 9 до 0, установите признак пе- 
реноса; 


4) вернитесь к шагу [; 


Протестируйте свой код на примере следующих операций сложения: 0+0, 0+1, 
1+0, 1+2,5+5,9+1и9 +9. 


Ответ. Файл РуШоп Ех__1_$1п81е_4181*_аддег.ру содержит код сумматора: 


#1Лизг/Б1пт/епу руПоп 
"""ЕХ 1 $1п61е_4181*_ад4ег.ру: ответ на упражнение 1 главы 1.""" 


1трог® $у$ 


# Выполним один шаг операции сложения аналитической машины. 
# аиБ - слагаемые, с - признак переноса. 
де{ 1псгетеп*_аддег(а, БЬ, с): 
а=а-1 # Уменьшим слагаемое на 1 
6 = (6+1) % 19 # Увеличим аккумулятор на 1, 
# при необходимости Выполним переход к @ 
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1+Ь == 0: # Если аккумулятор равен @, увеличим признак переноса на 1 


с=с+1 


гефигп а, Ь, с 


# Сложим две десятичные цифры, переданные 6 командной строке. 


# Сумма возвращается 6 Виде 41912 и признака переноса (0 или 1). 


де+ ад9_91214$(4161%1, 912142): 
саггу = 9 


ий3]е 412141 > 0: 
[912141, 412142, саггу] = 1тсгетепе _ааддег( 
416141, 916142, саггу) 


гефигп 4181%2, саггу 


Файл Ех__1_%е54_51п61е_41в1_а44ег.ру содержит код тестов: 
#!1/изг/Бтп/епу руЁпоп 


Ех 1 %е${ $1п51е_4161{_аддег.ру: тесты для ответа на 


упражнение 1 главы 1.""" 


1трог{ ип1{е$+* 
1трогф Ех _1 $1пр1е_4161*<_адаег 


с1а$$ Те5{51п8р1е0161{Адаег (ип1е$* .Те$*Сазе): 
4е+ +е$*_1(5е1+): 
5е1+.а$5ег{Едца1 (Ех _1_$1п61е_4121&_адаег.ад4_91621*$( 
о, о), (©, е©)) 


де+ +е$*_2($е1+): 
5е1+.аззег%Едиа1(Ех__1_$1п61е_4161{_ад4ег.а49_916е1*$( 
9, 1), (1, 0)) 


ае+ +е$5*_3($е1+4): 
5е1+.а$5егЕдца1 (Ех__1_$1п81е_4161*+_аддег.ада_4181*$( 
1, 0), (1, 0)) 
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де+ +е$*_4($е1+): 
5е1+.а5егЕЕдиа1 (Ех__1 $1п6]е_4121%_ад4ег.ад9_4121\*$( 
1, 2), (3, 0)) 


де+ +е$+_5(5е1+): 
5е]1+.азегЕЕдиа1 (Ех__1_$1п8]е_41621«_ад4ег.ада_41е1*$( 
5, 5), (0, 1)) 


де+ +е5*_6(5е1+4): 
5е1+. аззегЕЕдиа1(Ех__1_$1п81е_4161{_а44ег.а94 4111$ ( 
9, 1), (@, 1)) 


де+ +е$*_7($е1+): 
5е1+.аз5ег{Едиа1 (Ех__1_$1п21е_41214 аддег.аа4 41214$( 
9, 9), (8, 1)) 
1+ _ пате__ == '_ машт__': 
ипГЕе$* .та1п() 


Для того чтобы выполнить тесты, при условии, что Ру®оп установлен и находится 
по известному системе пути, выполните следующую команду: 


ру{Поп Ех__1 %е5{ $1п8]е 4121 адаег.ру 


Р езультат выполнения тестов: 


С:\>ру{Поп Ех__1 Тез& $1п]е 4181% адаег.ру 


Кап 7 Ее$%$ 1п 9.0015 
око 


Упражнение 2 


Создайте для слагаемого, аккумулятора и признаков переноса массивы из 40 деся- 
тичных цифр каждый. Запросите у пользователя два целых десятичных числа дли- 
ной до 40 цифр каждое. Выполните сложение чисел, цифра за цифрой, используя 
циклы, описанные в упражнении 1, и соберите выходные данные в виде признаков 
переноса из позиции каждой цифры в массиве признаков переноса. После заверше- 
ния циклов вставьте переносы и, при необходимости, распространите их по циф- 
рам, чтобы завершить операцию сложения. Выводите результаты на экран после 
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каждого цикла и по завершении. Проведите тест с теми же суммами, что и в 
упражнении [, а также проверьте суммы 99 + 1, 999999 + 1, 49 + 50 и 50 + 50. 


Ответ. Файл Руоп Ех__2_40_4161+_аддег.ру содержит код сумматора: 


#!Лизг/Бтп/епу руЕПоп 


"""Ех__2_ 40 91614 а4дег.ру: ответ на упражнение 2 главы 1.""" 


роге $у$ 
1троге Ех__1_$1п61е_4151*_аддег 


# Сложим два десятичных числа длиной до 40 цифр и возбвратим сумму, 
# Входные и выходные числовые значения представлены 6 виде строк. 
деф ада_49_91614$($%г1, $г2): 

тах_4161%$ = 40 


# Преобразуем $1г1 6 десятичное значение длиной 4@ цифр 
пут1 = [9]*тах_41611$ 
фог 1, с 1п епитега*е(геуег$ед($г1)): 

пит1[1] = 1п%(с) - 17*('0') 


# Преобразуем $%г2 6 десятичное значение длиной 40 цифр 
пит2 = [9)*тах_9121%5 
Фог 1, с 1т епитегате(геуег$еа( $*{г2)): 

пыут2[1] = 1пЕ(с) - 110’) 


# Просуммируем цифры 6 каждой позиции и запишем 

# признак переноса для каждой позиции 

ит = [9]*тах_4161%$ 

саггу = [9]*тах_4161%$ 

ог 1 1т гапве(тах_41651{5): 
(зит[1], саггу[1]) = Ех 1 _$1п61е_41621%_адаег. \ 
аа4_916е14$ (пит1[1], пит2[1]) 


# Распределим значения признаков переноса по цифрам 
фог 1 4п гапве(тах_91814$-1): 
1+ (саггу[1] == 1): 
$ит[1+1] = ($4т[1+1] + 1) % 10 


Ответы к упражнениям 


1+ ($4т[1+1] == 0): 
саггу[1+1] = 1 


# Преобразуем результат В строку с удаленными 
# начальными нулями 

зит.геуег$е() 

$иТ_54г = "".)]о1п(тар($4г, зит)) 

$ИТ_5Г = $ит 5%г.1$4г1р('0') ог '0' 

гефигп $ит_$5г 


Файл Ех__2_+е5*_409_4161*_аддег.ру содержит код тестов: 


#!/изг/Б1п/епу руЕПоп 
"""ЕХ _2_4е$%_49_9184* аддег.ру: тесты для ответа на упражнение 2 главы 1.""" 


1трогЕ ип1{е$+ 
1трог+ Ех _2_409_4161*_аддег 


с1аз$ Тез{400161«Аааег (ип е$* .Тез{Сазе): 
деф +е5*_1(5е1+): 
5е1+.аззег{Едиа1 (Ех__2_49_9161«_аддег.ада_49_41е14$( 
"0", "@"), "@") 


деф %е$*_2(5$е1+): 
5е1+.аз5егЕдца1 (Ех__2_40 41514 а4дег.ада_49_41в11$( 
"0", 1“), "1") 


де+ +е$*_3($е1+): 
5е14+.аззегЕдиа1 (Ех__2_49_41е1+_аддег.а499_49_41614$( 
1", "0"), "1") 


де+ +е$*_4(5е1+): 
5е1+.аз5егЕЕдиа1 (Ех__2_40_4121*_адаег.а4д_40_9151%5( 
ия "2"), "3") 


е+ %е5%_5($е1+): 


$е1+.аззегЕдиа1(Ех__2_49_4151*_адаег.ада_49_4161*$( 
5 5") "10") 
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де+ те$*_6($е1+): 
5е1+.аззегЕдиа1(Ех__2_40_4121*_ад4ег.ад4_40_91614$( 
ам т "10") 


де+ %е5*_7($е1+4): 
5е1+.а5зегЕдиа1 (Ех _2_4@_ 41614 а4дег.а49_40_4161*$( 
"9", "9"), "18") 


де+ +е$*_8(5е1+): 
5е1+.а$зег{Едиа1 (Ех__2_40 41214 аддег.а49_40_41е1%$( 
"99", ет "100") 


4е+ +е5* 9(5е1+): 
5е1+.аззегЕдиа1 (Ех__2_40_4161%_аддег.ада_40_41614$( 
"999999", "1"), "1000000" 


де+ +е5*_10(5е1+4): 
5е1+.аззегЕдиа1 (Ех _2_40 _4161*_аддег.а9д_49_9161*$( 
д "50"), "99") 


ее +е$*_11(5е1+): 
5е]1+.а55ег+Едиа1 (Ех__2_40_ 41614 аддег.ад4_40_91214$( 
"50", "50”), "100") 


1+ _ пате__ == '__ма?т__ 


ип е$* .та1п() 


Для того чтобы выполнить тесты, при условии, что Руфоп установлен и находится 
по известному системе пути, выполните следующую команду: 


ру{Поп Ех__2 фе5{ 40 49151{ адаег.ру 


Результат выполнения тестов: 
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Упражнение 3 


Измените программы упражнений /[ и 2 так, чтобы реализовать вычитание 40-знач- 
ных десятичных значений. Выполняйте заимствование по мере необходимости. 
Проверьте программу на примере разностей 0—0, 1-0, 1000000 — 1 и0- 1. Каков 
результат операции 0 - 1? 


Ответ. Файл Рушоп Ех__3 $1п81е_41е1 зибЕгас®ог.ру содержит код одноразрядного 
вычитателя: 


#!Иизг/Бтп/епу руПоп 


Ех__З $1п61е_41621* сибегас®ог.ру: ответ на упражнение 3 главы 1 


(одноразрядный вычитатель). 


роге $у$ 


# Выполним один шаг операции вычитания аналитической машины. 
#аиь - уменьшаемое и вычитаемое (а - Ь), 

# с - признак переноса: 0 = с заимствованием, 1 = без заимствования 
де+ аесгетепе_зи6{гасфог(а, Б, с): 


а = (а - 1) % 16 # Уменьшим левый операнд или на 1, или до 9 86 случае переноса 

Б=6-1 # Уменьшим аккумулятор на 1 

14а == 9: # Если аккумулятор достиг 9, уменьшим признак переноса на 1 
с=с-1 


гебугп а, 6, с 
# Выполним вычитание двух десятичных цифр. Разность возвращается В виде 491*1, 
# а признак переноса рабен 0 (при заимствовании) или 1 (без заимствования). 
де+ зибЕгас*_41614$(4912141, 912142): 

саггу = 1 


имй1]е 415142 > 0: 


[916141, 916142, саггу] = десгетепе_зибгаског( 
412141, 416142, саггу) 


гефигп 416141, саггу 
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Файл Ех__ 3 +е5*_$1п61е_4181%_си6гасфог.ру содержит код тестов для одноразрядного 
вычитателя: 


#1Лизг/Бтп/епу руЁПоп 


"""(х__3З $е5*_$1п81е_4161*_зи6%гасфог.ру: тесты для ответа на 
упражнение 3 главы 1 (тесты для одноразрядного 


вычитателя). 


1троге ип1 ет 
1троге Ех__3_$1п81е_4161*_зиб{гаског 


с1а$$ Те$+$1п81е0181$и6гаског (ип1е${+ .Те$*Сазе): 
Дде+ +е$+_1($е1+): 
5е1+.а5зег%Едиа] (Ех__3_$1п81е_49161*_зибгаског. 
зибгас®_91814$(0, ©), (09, 1)) 


де+ +е$+_2(5е1+): 
5е1+.аззегЕдиа1(Ех__3_$1п81е_4161*_сиБ*гаског. 
зибегас*_41814$(0, 1), (9, 0)) 


де+ +е$*_3($е1+): 
5е]+.аззег*Едца] (Ех__3_$1п81е_49181*_зибгаског. 
зибегас*_91814$(1, 9), (1, 1)) 


де+ +е$*_4($е1+): 
5е1+.аззегЕадца1 (Ех__3_$1п81е_41621*_зибегаског. 
$ибЕгас*_49181*$(1, 2), (9, 9)) 


деф +е$*_5(5е1+4): 
5е1+.а5зег&Едиа] (Ех__3_51п61е_41614_сибегаског. 
$ибфгас*_41в14$(5, 5), (0, 1)) 


де+ +е$+_6($е1+): 
$е1+.аззег{Едца1 (Ех__3_$1п61е_4151*_зибТгаског. 
$ИбЕгас*_41814$(9, 1), (8, 1)) 


де+ +е$*_7(5е1+): 
5е1+.а$зег%Едиа1 (Ех__3_$1п81е_4161*_зибЕгас®ог. 
зибегас®_41в1%4$(9, 9), (0, 1)) 
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1+ _ пате__ == '_тма1п__': 


ип ез${+ .та1п() 


Файл Рушоп Ех __3_49_9181+_5и6{гаског.ру содержит код 40-разрядного вычитателя: 


#!Иизг/Бтп/епу ру Роп 


"""Ех__3_49_49161*_и6гасфог.ру: ответ на упражнение 3 главы 1.""" 


1троге $у$ 
1троге Ех__3_$1п81е_4151*_зибтгаског 


# Вычтем одно десятичное число длиной до 40 цифр из другого 
# и возвратим результат. Входные и Выходные числовые значения 
# представлены 6 виде строк. 
де+ зибфгас®_49_91614$($4г1, $%г2): 

тах_91614$ = 40 


# Преобразуем $1г1 В десятичное значение длиной 40 цифр. 
пит1 = [9]*тах_916145 
ог 1, с 1т епитегате(геуег<ед( ${г1)): 

пиут1 [1] = 1т%(с) - 11*('0’) 


# Преобразуем $%г2 В десятичное значение длиной 49 цифр. 
пит2 = [9]*тах_91614$ 
фог 1, с 1т епитегате(геуегзеа ($%г2)): 

пиут2[1] = 11(с) - (‘0’) 


# Вычтем цифры 6 каждой позиции и запишем 
# признак переноса для каждой позиции. 


91+ = [9]*тах_912145$ 

саггу = [9]*тах_9151+$ 

Фог 1 т гапве(тах_4161*$): 
(аз1+Е[1], саггу[1]) = Ех__3_$1п61е 411% зибгас®ог. \ 
зуб егас*_91в14$(пит1[1], пит2[1]) 


# Распределим значения признаков переноса по цифрам. 
Фог 1 1т гапве(тах_418115$-1): 
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1+ (саггу[1] == 0): 
914+[3+1] = (91+Е[1+1] - 1) % 10 
1+ (а1[141] == 9): 
саггу[1+1] = 9 


# Преобразуем результат В строку с удаленными 
# начальными нулями 

91+ .геуег$е() 

ЧТЕЕ 5%Г = "".)одп(тар($%г, 91+Е)) 

ЧЕ $%г = ЧЕ $г.1$4г1р('0') ог '0' 

гефигп НЕЕ $ 


Файл Ех 3 +е5*_49_ 41614 зибегаског.ру содержит код тестов для 40-разрядного вы- 
читателя: 


#!Лизг/Блп/епу руЁпоп 
"""Ех _3 +е5+_49 4121«_сиб{гас®ог.ру: тесты для ответа на упражнение 3 главы 1.""" 


роге ип1 вез 
роге Ех _3 49 _4151*_сибфгас®ог 


с]1а$$ Те${400151ЕбиБЕгаског (ип1{%е$* .Те${Сазе): 
де +е5*_1(5е1+): 
5е]+.аз5ег%Едиа1 (Ех__3_40_41514_зибгас®ог. 
5ибЕгас®_49_41214$5("0", "0"), "@") 


де+ +ез*_2($е1+): 
5е1+.а$5егЕЕдиа1(Ех__3_49_4161%_сиб%гасфог. 
зибегасе_49_41614$5("1", "0"), "1") 


деф +е$*_3(5е1+): 
5е1+.а$5егЕдца] (Ех__3_49_а151*_зибегас®ог. 
зибегасе_49_41214$("1000000", "1"), "999999" 


де+ +е$*_4(5е1+): 
$е1+.а$5егЕЕдца1(Ех__3_40_4151*_зиБегас®ог. 
$ибгасе_40_41е14$("0", "1"), 
"9999999999999999999999999999999999999999") 


1+ _ пате__ == '__ ма?п__ 


ип Ее$*.та1п() 
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Для того чтобы выполнить тесты, при условии, что Руфоп установлен и находится 
по известному системе пути, выполните следующие команды: 


руфпоп Ех__3 фе$® $1пр]е 41518 зиб{гас®ог.ру 


руЕпоп Ех__ 3 {ез{ 49 121 зибтгас®ог.ру 


Это результат выполнения тестов Ех__3 %е$+_51п61е_4181*_ибгасфог.ру: 


С:\>руфНоп Ех__3 Фе5% $1п51е 9121 зибфгасфог.ру 


Вап 7 Тезф 5 1т 9.0915 ОК 


Это результат выполнения тестов Ех__3 +е5*_40_4151%_сиб%гаског.ру: 


С:\>руПоп Ех 3 е$% 40 41214 зибфгасфог.ру 


Кап 4 {е$45$ 1т 0.0915 ОК 


Результат для 0 - 1 равен 9 с признаком переноса, равным 0. 


Упражнение 4 


Язык ассемблера процессора 6502 ссылается на данные в ячейках памяти, исполь- 
зуя значение операнда, содержащее адрес (без символа #, который указывает на не- 
посредственное значение). 


Например, инструкция РА $609 загружает в регистр А байт, находящийся в памяти 
по адресу $00. $ТА $01 сохраняет байт из регистра А по адресу $01. Адреса могут 
иметь любое значение в диапазоне от 0 до $ЕЕЕЕ при условии, что по указанному 
адресу имеется физическая память и этот адрес не используется для каких-либо 
других целей. С помощью предпочтительного эмулятора процессора 6502 напиши- 
те код на ассемблере 6502 для сохранения 16-битного значения по адресам $00- 
$01, сохраните второе значение по адресам $02-$03, затем сложите эти два значе- 
ния и сохраните результат по адресам $04—$05. Обеспечьте распространение пере- 
носов между двумя байтами. Игнорируйте любой перенос из 16-битного результа- 
та. Проверьте код на примерах $0000 - $0001, $00ЕЕ + $0001 и $1234 + $5678. 


Ответ. Файл на ассемблере 6502 Ех_4_16_Ы1* ааа11оп.азт содержит код сложения 
16-битных значений: 


; Ех_4 16 ТЕ ааа Топ. авт 
; Попробуйте запустить этот код по адресу 
; ИЕЪр$: //$ЕТагтсЕ. дТЕРиЬ. 1о/еазуб502/ 
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; Задайте значения для сложения. 
; Удалите соответствующие точки с запятой, чтобы Выбрать байты для добавления: 
; ($0000 + $0001) или (З090ЕЕ + $0001) или ($1234 + $5678) 


ГОА #$00 
ИОА #$ЕЕР 
ИОА #$34 
ЗТА $00 


|ЮА #$00 
ПОА #300 
ИА #$12 
ЗТА $01 


ГРА #$01 

ИОА #$01 
ОА #878 
ЗТА $02 


год #$ее 
ИФА #$00 
ИДА #$56 
ТА $03 


; Сложим два 16-разрядных значения 
СС 

ГРА $00 

АБС $02 

ТА $04 


ЕОА $91 
АОС $03 
ТА $05 


Попробуйте запустить этот код по адресу ВИ рз://5 КШанск.о Ви .10/еазу6502/. 


Упражнение 5 


Напишите на ассемблере 6502 код для вычитания двух 16-разрядных значений спо- 
собом, аналогичным показанному в упражнении 4. Проверьте код на примерах 
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$0001 — $0000, $0001 — $0001, $0100 — $00ЕЕ и $0000 — $0001. Каков результат опе- 
рации $0000 — $0001? 


Ответ. Файл на ассемблере 6502 Ех__5_16_61{_зибкгас®1оп.азт содержит код вычита- 
ния |6-битных значений: 


; ЕХ_5 16 Е зирфгас Топ. авт 
; Попробуйте запустить этот код по адресу 
; НЕЕрз://5ЕТЦагтск. дТЕРиь.1о/еазуб502/ 


ъ` 


; Задайте значения для вычитания. 

; Удалите соответствующие точки с запятой, чтобы выбрать байты для 
; вычитания: 

(30001 - $0000) или ($0001 - $0001), или ($0001 - З090ЕР), или 
(50000 - $0001) 


`. 


ъ`. 


ГОА #$01 
ОА #$01 
ОА #801 
ЯДА #$00 
ТА $00 


ГРА #$00 
ОА #$00 
ОА #$00 
ФА #00 
УТА $01 


ТА #$00 

ИА #$01 
ГОА #ЗЕЕ 
ОА #901 
ТА $02 


ГОА #$00 
УРА #$00 
СОА #$00 
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ОА #$00 
ТА $03 


; Вычтем два 16-битных значения 
$ЕС 

Ед $00 

$ВС $02 

ЭТА $04 


ГОА $01 
5ВС $03 
$ТА $05 


Попробуйте запустить этот код по адресу ВИрз$://$3КШ@нскК.о Ви 1о/еа$у6502/. 
Результат для $0000 — $0001 равен $ЕЕЕЕ. 


Упражнение 6 


Напишите на ассемблере 6502 код для сохранения двух 32-разрядных целых чисел 
по адресам $00-$03 и $04-$07, а затем сложите их, сохранив результаты по адресам 
$08—$0В. Используйте циклическую конструкцию, включающую метку и команду 
ветвления, для перебора байтов двух складываемых значений. Найдите в Интернете 
подробную информацию об инструкциях уменьшения на | и ветвления для процес- 
сора 6502, а также об использовании меток в языке ассемблера. Подсказка: в этом 
приложении хорошо работает реализованный в процессоре 6502 режим адресации с 
индексированием нулевой страницы. 


Ответ. Файл на ассемблере 6502 Ех_6 32_ 61% ада141оп.азт содержит код сложения 
32-битных значений: 


; ЕХ_6_32 МЕ ааатЕтоп.азт 
; Попробуйте запустить этот код по адресу 
; ИЕр$://5ЕТИаглсК. дТЕВиЬ.10/еазуб502/ 


; Задайте значения для сложения. 

; Удалите соответствующие точки с запятой, чтобы Выбрать байты для 
; сложения: 

; (300000001 + $00000001) или (З9000ЕЕЕЕ + $00000001), или 
(ЗЕЕЕЕЕЕРЕ + $00000001), или (ЗЕЕРЕЕРЕЕ + $00000001) 


`. 
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[РА #$01 
ОА #$ЕЕ 
ПРА #$ЕЕ 
ОА #$ЕЕ 
<ТА $00 


грА #$ее 
ИФА #$ЕЕ 
ИФА #$ЕЕ 
ИРА #$ЕЕ 
СТА $01 


ГРА #$00 
ОА #00 
ГОА #ФЕЕ 
ОА #®ЕЕ 
ТА $02 


ГОА #$00 
ГОА #$00 
УГРА #$ЕЕ 
ИФА #$ЕЕ 
$ТА $03 


(ФА #$01 
ТА $04 


ГРА #$00 
ЗТА $05 
ТА $06 
ЗТА $07 


; Сложим два 32-битных значения, используя 
; режим абсолютной индексной адресации 

ьох #$ее 

ЬОУ #$04 

СЕС 
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АОБ_1ООР: 
ГРА $00, Х 
АБС $04, Х 
ЗТА $08, Х 
ТМ 

БЕУ 

ВМЕ АОО_1ООР 


Попробуйте запустить этот код по адресу В®рз://5 КШанск.еИпи6 1о/еазу6502/. 


Глава 2. Цифровая логика 


Упражнение 1 


Измените схему,. представленную на рис. 2.5, чтобы превратить вентиль И в вен- 
тиль И-НЕ. Подсказка: добавлять или удалять компоненты не требуется. 


Ответ. Переместите резистор А› и ток вывода выходного сигнала так, как показано 
на рис. П1. 


Выход 


ОВ 


Рис. П1. Схема вентиля И-НЕ 


Упражнение 2 


Создайте реализацию схемы вентиля ИЛИ, изменив схему, представленную на 
рис. 2.5. По мере необходимости можно добавлять провода, транзисторы и рези- 
сторы. 


Ответы к упражнениям 531 


Ответ. Схема вентиля ИЛИ выглядит так, как представлено на рис. П2. 


Выход 


ОВ 


Рис. П2. Схема вентиля ИЛИ 


Упражнение 3 


Найдите в Интернете бесплатные программные пакеты для разработки на языке 
УНОГ, включающие имитатор. Установите один из этих пакетов, настройте его и 
попробуйте создать любые простые демонстрационные проекты, включенные в со- 
став пакета, чтобы убедиться, что он работает должным образом. 


Ответ. Ниже приведены некоторые бесплатные пакеты для разработки на языке 
УНОГ: 


1. 


Пакет ХШих У!уадо Оезрп доступен по адресу ВИрз://му\у\.хШих.сот/ 
зиррог/домоад.В 1. 


. Пакет ие Опациз” Рите Зоймаге Те ЕЧШюп доступен по адресу 


Юрз: ууу ие. сот/сотеп ум у/и5/еп/зоууаге/ргоргатта е/диаги$-ргите/ 
домушюа@.Б 1. 


. ОНОГ, пакет моделирования для УНПГ. с открытым исходным кодом доступен 


по адресу ВИр$://2ИВиБ.сот/? ВИ? В а1. 


. Пакет Метшог Моде5т РЕ Задеи ЕФшюп доступен по адресу 


Врз://у\уу.тешог.сот/сотрапу/фвег_ед/тоде!$1т-5иеп!-е оп. 


. Пакет Еестотс Пез1рп АцютаНоп (ЕШОА) Р]аургоупд доступен по адресу 


Врз://уууууу. едар!аургоипд.сот/. 


В примерах для главы 2 и следующих глав будет использоваться пакет У1уадо 
Оезрп Зице, в том числе для загрузки схемных решений в недорогую плату разра- 
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ботки ПЛИС. Ниже приведена процедура установки и настройки этого пакета для 
УЛпдо\уз 10: 


1. 


Посетите веб-сайт В@рз://\у\у\.хШах.сот/биррог/до\утоа9.В6т! и выберите 
веб-установщик для последней версии У1уадо Оезрп ЗиИе Юг \Мтдо\з. Необхо- 
димо выбрать полный установщик У1уа40, а не обновление. При этом вам по- 
требуется создать учетную запись ХШих, если у вас ее еще нет. Обязательно со- 
храните имя пользователя и пароль своей учетной записи для использования в 
дальнейшем. 


Введите запрошенную информацию, скачайте установщик У тдом$ Зе“ 
Ехгас_пр? У’еь шуаПег и запустите его. Возможно, вам потребуется изменить 
настройки для установки приложений У/1пд0\$, чтобы разрешить запуск про- 
граммы установки. 


Вам будет предложено войти в систему, используя данные вашей учетной запи- 
си ХШих, и подтвердить согласие с условиями лицензионных соглашений. 


. Выберите пакет инструментов, который вы хотите установить. Для примеров в 


этой книге используется У1уадо. Выберите Ухадо и щелкните М№ех# (Далее). 


Выберите Ууадо НГ УеЬРасК (это бесплатная версия). Щелкните Мехе (Далее). 


6. Подтвердите согласие с предложенной по умолчанию конфигурацией инстру- 


ментов проектирования, устройств и параметров установки для У1уадо НГ. 
Уебраск. Щелкните Мехе (Далее). 


Подтвердите согласие с предложенным по умолчанию каталогом установки и 
другими параметрами. Щелкните Мех (Далее). 


На странице $баПаНоп Зититагу (Сводка результатов установки), щелкните 
ша (Установить). Загрузка и установка займут некоторое время. Требуемое 
для этого время зависит от скорости вашего интернет-соединения. Запланируйте 
ожидание на несколько часов. 


После завершения установки выполните следующие действия, чтобы создать при- 
мер проекта: 


1. 


На рабочем столе найдите значок с именем, похожим на Утадо 2021.2. Дважды 
щелкните на этом значке (а не на значке с надписью Ууа4до НГ5), чтобы запус- 
тить данное приложение. 


2. В главном окне Упуадо нажмите Ореп Ехатр!е Ргодес (Открыть пример проекта). 


3. Перейдите к окну З@есё Ргодесё Тетр!ме (Выбор шаблона проекта) и выберите 


СРО (НОГ). 


На следующих экранах просмотрите и подтвердите согласие со значениями по 
умолчанию и щелкните ЕйизВ (Готово), чтобы создать проект. 


На странице Ргодес{ Мапарег (Диспетчер проектов) вы найдете панель Зоигсез 
(Источники). Разверните древовидный список и дважды щелкните на некоторых 
файлах, чтобы открыть их в редакторе. Большинство файлов в этом примере 
проекта написаны на языке описания аппаратных средств УеШор. 


6. 
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Щелкните Вип Зупе$15 (Запустить синтез) на панели Рго}есё Мапарег (Дис- 
петчер проектов). По мере выполнения синтеза на панели Везюп Вип$ (Выпол- 
нение проекта) будет обновляться информация о состоянии. Это может занять 
несколько минут. 


После завершения синтеза отображается диалоговое окно с предложением за- 
пустить реализацию. Щелкните Сапе] (Отмена). 


Щелкните Вип ЗпишШайоп (Запустить моделирование) в разделе Ргоес 
Мапарег (Диспетчер проектов) главного окна У1уа4о, затем выберите Вип 
Ъепау!юга! зппи!айоп (Запустить моделирование поведения). Это также может 
занять несколько минут. 


После завершения моделирования в окне ЗиишайНоп (Моделирование) поя- 
вится временная диаграмма, отображающая сигналы ЦП, смоделированные с 
использованием входных данных, предоставленных в исходных файлах моде- 
лирования. 


10. На этом упражнение завершается. Вы можете закрыть У1уадо. 


Упражнение 4 


Используя набор инструментов УНОГ, создайте 4-разрядный сумматор с помощью 
листингов, представленных в главе 2. 


Ответ. Для создания 4-разрядного сумматора выполните следующие действия: 


1. 


Дважды щелкните на значке Ууа4о 2021.2 (или подобном), чтобы запустить 
У!уадо. 


Щелкните Сгеае Рго]есе (Создать проект) в главном окне Утуа4до. 


3. С помощью мыши просмотрите и примите предложенные по умолчанию назва- 


ние и местоположение проекта. 


Выберите ВТЕ Рго]есё — тип проекта по умолчанию. 


5. На странице Оеаий Рам (Часть по умолчанию) выберите Воаг4$ (Платы). Вве- 


дите дгеу в поле поиска, выберите Аму А7-35, затем щелкните Мех (Далее). Ес- 
ли в результате поиска Агбу не отображается, щелкните Орде Воага 
ВерозНоне$ (Обновить репозитории плат) и выполните поиск снова. 


6. Нажмите ЕиизВ (Готово) для создания проекта. 


7. На панели Ргодесё Мапарег (Диспетчер проектов) щелкните А994 Зоигсе$ (Доба- 


вить источники), выберите А9Ф ог сгеже 4ерп зоигсе$ (Добавить или создать 
источники проекта), добавьте файлы Ех __4_аддег4.упа1 и Ех __4 +и11аддег.уНа1, за- 
тем щелкните Ени$й (Готово). 


В окне Рго]есё Мапарег (Диспетчер проектов) разверните дерево окна Вееп 
Зоигсез (Источники проекта) и найдите два добавленных вами файла. Дважды 
щелкните на каждом из них и разверните окно исходного кода, чтобы просмот- 
реть код. 
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Щелкните Кип Зупе$15$ (Запустить синтез) на панели Рго}десё Мапасег (Дис- 
петчер проектов). Оставьте для параметров в окне ГаипесВ Вип$ (Выполнение 
запуска) значения по умолчанию и нажмите ОК. По мере выполнения синтеза 
на панели еп Вип$ (Выполнение проекта) будет обновляться информация о 
состоянии. 


10. Дождитесь завершения синтеза, затем в окне Зупез1$ Сотр!ее@ (Синтез за- 


вершен) выберите Улем Верогё (Просмотр отчетов). Дважды щелкните на не- 
которых отчетах, созданных в процессе синтеза. В наличии имеются только те 
отчеты, значок которых помечен зеленой точкой. 


11. На этом упражнение завершается. Вы можете закрыть У1уадо. 


Упражнение 5 


Добавьте в свой 4-разрядный сумматор код тестового драйвера (примеры можно 
найти в Интернете по фразе "ИНГГ, 1е;епсй"), затем запустите его с ограниченным 
набором входных данных и проверьте правильность выходных данных. 


Ответ. Выполните следующие действия для тестирования проекта 4-разрядного 
сумматора, созданного в упражнении 4: 


1. 


Дважды щелкните на значке Улуа4до 2021.2 (или подобном), чтобы запустить 
Утуадо. 


Щелкните Ореп Ргодесй (Открыть проект) в главном окне У!уа4до и откройте 
проект, который вы создали в упражнении 4. Необходимо выбрать файл проекта 
с расширением „хрг. 


. На панели Рго]есё Мапарег (Диспетчер проектов) щелкните АВ@ Зоигсе$ (Доба- 


вить источники), выберите А@Ф ог сгежме знишаНоп зоигсез (Добавление или 
создание источников моделирования), добавьте файл Ех__5_а44ег4_+ез+Бепсй .УПа1, 
затем щелкните ЕйизВ (Готово). 


. В окне Ргоесё Мапарег (Диспетчер проектов) разверните дерево окна Оезрип 


Зоигсез (Источники проекта) и найдите добавленный вами файл. Дважды щелк- 
ните на этом файле и разверните окно исходного кода, чтобы просмотреть код. 
Обратите внимание на шесть тестовых сценариев, присутствующих в коде. 


Щелкните Вип Зипщайоп (Запустить моделирование) в разделе Ргодес 
Мапарег (Диспетчер проектов) главного окна У1уадо, затем выберите Вип 
Бепау!ога| зниШайоп (Запустить моделирование поведения). 


Дождитесь завершения моделирования, затем разверните-окна с временной диа- 
граммой (возможно, обозначенной ОпиЧеа 1). 


. Используйте значок увеличительного стекла и горизонтальную полосу прокрут- 


ки окна, чтобы просмотреть шесть тестовых сценариев за первые 60 наносе- 
кунд (нс) выполнения. Определите, правильно ли указаны сумма и признак пе- 
реноса для каждой операции сложения. Для того чтобы обновить информацию в 
столбце Уаше (Значение), можно перетащить желтый маркер. 
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8. На этом упражнение завершается. Вы можете закрыть У1уадо. 


Код набора тестов содержится в УНОГ--файле Ех__5_а44ег4_+езБепсН .мпа1: 


116гагу ТЕЕЕ; 
и5е ТЕЕЕ.$ТО_10ОСбТС_1164.АЦЕ; 


епЕ1Фу АООЕВ4 ТЕЗТВЕМСН 15 
еп еп1+у АОБЕВ4_ТЕЗТВЕМН; 


агси1+есфиге ВЕНАУМТОВАЕ о+ АОСОЕКА_ТЕЗТВЕКН 15$ 


сотропеп* АБОЕВА 1$ 


роге ( 
Ад : м $14_1051с_\мес*ог(3 домпко 0); 
[570 : м $44 1о81с_месфог(3 домпко 0); 
ИМ : 0 $4 1ор1с_уесфог(3 домпФо 0); 
С Л4 : ОЕ $44 1061с 

); 


еп сотропеп*; 


$1епа1 а : $44 1о81с_уесфог(3 аомтфо 0); 
$16па1 Б : 544 1ов1с_месфог(3 аомптео 0); 
$1епа1 $ : 54 1ов1с_уесфог(3 аомпфо 0); 


$18па1 с_оце : $4 1о61с; 


Бер]п 


ТЕЗТЕО_ОЕУТСЕ : АООЕВ4 
рог тар ( 
АЗ => а, 
В4. => Б, 
ИМ => $, 
С (ЛА => с о 


ТЕЗТ : ргосе$$ 
беё1п 
а <= "0000"; 
Ь <= "0000"; 
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ма1{ ог 10 пс; й 
а <= "0110"; 
Ь <= "1100"; 


ма1* ог 10 п$; 
а <= "1111"; 
Ь <= "1100"; 


мате ог 10 п$; 
а <= "0119"; 
Ь <= "0111"; 


ма1{ +ог 19 п$; 
а <= "01109"; 


Ь <= "1119"; 


ма1* Фог 10 п$; 


а <= "1111"; 
Ь <= "1111"; 
ма1*; 


епа ргосе$$ ТЕЗТ; 


еп агсп1%ес®иге ВЕНАУТОВАГ; 


Упражнение 6 


Раскройте код тестового драйвера и убедитесь, что 4-разрядный сумматор выдает 
правильные результаты для всех возможных комбинаций входных данных. 


Ответ. Выполните следующие действия для тестирования проекта 4-разрядного 
сумматора, созданного в упражнении 4: 


1. Дважды щелкните на значке Ууадо 2021.2 (или подобном), чтобы запустить 
УМ!уадо. 


2. Щелкните Ореп Ргодесё (Открыть проект) в главном окне У1уа4до и откройте 
проект, который вы создали в упражнении 4 и изменили в упражнении 5. Необ- 
ходимо выбрать файл проекта с расширением „хрг. 


3. Мы собираемся заменить код тестового драйвера в упражнении 5 другим кодом 
тестового драйвера. В окне Ргодесё Мапарег (Диспетчер проектов) разверните 
дерево окна ЗнишШаНоп Зоигсе$ (Источники моделирования) и найдите модуль, 
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14. 


который был добавлен в упражнении 5 (АБФЕВ4_ТЕЗТВЕМСН). Щелкните правой 
кнопкой мыши на имени модуля, выберите Ветоуе Ее {гот Ргодес{ (Удалить 
файл из проекта), затем щелкните ОК, чтобы подтвердить удаление. 


На панели Ргодесё Мапарег (Диспетчер проектов) щелкните А@Ф Зоигсез (Доба- 
вить источники), выберите А@@ ог сгемже знишайоп $зоигсез (Добавление или соз- 
дание источников моделирования), добавьте файл Ех __6_аддег4._ +и114е5Бепсв .мпа1, 
затем щелкните Ени$В (Готово). 


В окне Ргодесё Мапарег (Диспетчер проектов) разверните дерево окна еп 
Зоигсез (Источники проекта) и найдите добавленный вами файл. Дважды 
щелкните на этом файле и разверните окно исходного кода, чтобы просмотреть 
код. Обратите внимание на размещенный в коде цикл с 256 тестовыми сцена- 
риями. 


Щелкните Вип Зиишайоп (Запустить моделирование) в разделе Ргоес 
Мапарег (Диспетчер проектов) главного окна У1уа4до, затем выберите Вип 
Бевауюга! зпшавоп (Запустить моделирование поведения). 


Дождитесь завершения моделирования, затем разверните окна с временной 
диаграммой (возможно, обозначенной Опи@ед 1). 


Для просмотра тестовых сценариев используйте значок увеличительного стекла 
и горизонтальную полосу прокрутки окна. Ой! Выполнение останавливается 
через 1000 нс — этого недостаточно для выполнения всех тестов. 


Щелкните правой кнопкой мыши на Зиишайоп (Моделирование) в панели 
Рго]есё Мапарег (Диспетчер проектов), затем выберите Зиишайоп Зе@ть$... 
(Настройки моделирования...). 


. Выберите вкладку ЗнищавНоп (Моделирование) и измените значение параметра 


х$1т. $1ти1ае.гипейте на 300015. Щелкните ОК. 


. Щелкните х в окне Зипшабоп (Моделирование), чтобы закрыть его. 
. Снова запустите процесс моделирования. 


. После раскрытия и масштабирования временной диаграммы вы сможете уви- 


деть все 256 тестовых сценариев. Проверьте, есть ли на графике места, где сиг- 
нал ошибки имеет значение 1. Это указывало бы на то, что выходные данные 
сумматора не соответствуют ожидаемым выходным данным. 


На этом упражнение завершается. Вы можете закрыть У1уа4о. 


Код набора тестов содержится в УНОГ-файле Ех__6 аддег4_+и114езЕбепси .\па1: 


116гагу ТЕЕЕ; 
иузе ТЕЕЕ.$ТО_1О06ТС_1164.АШЕ; 
узе ТЕЕЕ.№ММЕВТС_$ТО.АЁЬ; 


епЕ1еу АБОЕВ4_ТЕЗТВЕМСН 1$ 
епа епе1фу АООЕВ4_ТЕЗТВЕЖН; 


538 Приложение 
агси1Хесфиге ВЕНАУТОВАЕ о+ АООЕВА_ТЕЗТВЕМН 1$ 


сотропепе АПБОЕВА4 1$ 


роге ( 
А4 : 17 $19 _10о81с_мес®ог(3 домтфо 0); 
84 : т $44 1о0в1с_уес®ог(3 домпфо @); 
$ИМА : ОЕ — $44 10в1с уесвог(3 дотко 0); 
С 014 : 0 — $44 1081с 
); 
еп@ сотропеп*; 
$16па] а : 544 1ов1с_уес*ог(3 домпко ©); 
$15па1 Б : $44 1051с_уесфог(3 аохтко 0); 
$16па1 $ : 564 Лов1с_уес®ог(3 домпко 0); 
$16па1 с_ои* : $14 19061с; 


516па1 ехресфед_зит5 : иуп$1епед(4 домтфо 0); 
$16па1 ехресфед зитф : ип$1вптед(3 аоутео 0); 
$1епа1 ехресфе4_с : 544 1061с; 
$16па1 еггог : $14 1081с; 


беё1п 
ТЕЗТЕО ОЕМТСЕ : АООЕВ4 
роге мар ( 
Ад => а, 
[57.1 => Б, 
ИМ => $, 
С_ 04 => с_оцЕ 


ТЕЗТ : ргосе$$ 
Беё1п 


-- Протестируем все комбинации двух 4-разрядных слагаемых (всего 256 тестов) 
фог а_\а1 1дт © %о 15 1оор 
ог Б уа1 1п 0 Фо 15 1оор 
-- Установим входные данные для компонента АПБОЕВ4 
а <= $494 1ов1<_меског($о_ип$1впед(а_уа1, а'1епаеП)); 
Ь <= $44 1ов1с_меског(+о_ип$1епеа(Ь_\уа1, Б'1епеВ)); 
мал +ог 1 п$; 
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-- Вычислим 5-битную сумму двух 4-битных значений 
ехресфед_ит5 <= ип$1епед('0` & а) + ипз1епед('0' & 6); 
иа1+ ог 1 п$; 


-- Разобьем сумму на 4-разрядное Выходное значение и бит переноса 
ехрес%е $ит4 <= ехресфе4_$ит5(3 домпфо 0); 

ехрес*ей с <= ехресфе4_$ит5(4); 

ма1+ ог 1 п$; 


-- Сигнал ‘ошибка’ принимает значение 1 только при обнаружении ошибки 
1+ ((ип$1епед($) = ип$1впед(ехрескед _зит4.)) апа 
(с_оц{ = ехрес*ей с)) +Веп 
еггог <= '0'; 
е15е 
еггог <= '1'; 
епа 1+; 


-- Каждый проход через внутренний цикл занимает 10 нс 
ма1* ог 7 п$; 


епа 1оор; 
епа 1оор; 


ма1*; 
еп ргосез$ ТЕЗТ; 


еп агсп1Фесфиге ВЕНАУТОВАЕ ; 


Глава 3. Элементы процессора 


Упражнение 1 


Рассмотрим сложение двух 8-битных чисел со знаком (т. е. чисел в диапазоне от — 
128 до +127), где один операнд положительный, а другой — отрицательный. Суще- 
ствует ли какая-либо пара 8-битных чисел с разными знаками, сумма которых вы- 
ходит за пределы диапазона от —128 до +127? Такая ситуация будет представлять 
собой знаковое переполнение. Примечание: мы рассматриваем здесь только сложе- 
ние, потому что, как мы видели, вычитание в архитектуре процессора 6502 — это 
то же самое, что и сложение, но с инверсией битов правого операнда. 
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Ответ. Диапазон положительных (или неотрицательных) чисел — от 0 до 127. Диа- 


пазон отрицательных чисел — от —128 до —1. Для того чтобы охватить все возмож- 
ности, необходимо рассмотреть только крайние значения каждого из этих диапазонов: 


Из предыдущей таблицы видно, что не существует пары 8-битных чисел с разными 
знаками, сумма которых выходит за пределы диапазона от —128 до +127. 


Упражнение 2 


Если ответ на упражнение 1 — "нет", это означает, что единственный способ соз- 
дать знаковое переполнение — сложить два числа с одинаковыми знаками. Если 
происходит переполнение, что вы можете сказать о результате выполнения опера- 
ции "исключающее ИЛИ" между старшим битом каждого операнда и старшим би- 
том результата? Другими словами, каков будет результат выражений 1е+((7) ХОВ 
гези14 (7) и г1вйе(7) ХОВ гези1*«(7)? В этих выражениях (7) указывает на бит 7 — 
старший бит. 


Ответ. Бит 7 — это знаковый бит. Поскольку переполнение может произойти толь- 
ко тогда, когда оба операнда имеют одинаковый знак, то когда происходит пере- 
полнение, 1е (7) должно быть равно г1ей*(7). 

Когда происходит переполнение, знак результата отличается от знака двух операн- 
дов. Это означает, что гези1*(7) отличается от бита 7 обоих операндов. 


Поэтому всякий раз, когда происходит переполнение, 1е+{(7) ХОВ гези1*(7) =1и 
г1еН*(7) ХОК гези1*(7) = 1. 


Упражнение 3 


Посмотрите на листинг УНП. в разд. "Арифметико-логическое устройство" гла- 
вы 3 и определите, является ли логика установки и обнуления флага У корректной 
для операций сложения и вычитания. Проверьте результаты сложения 126 +1, 
127 +1,-127+ (-Г) и-128 + (-1). 


Ответ. Приведенный в главе 3 листинг реализации части арифметико-логического 


устройства (АЛУ) на языке УНОГ, подобного тому, что применяется в процессоре 
6502, выполняет вычисление флага переполнения с помощью следующего кода: 
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1+ (((1ЕРТ(7) ХОВ гези148(7)) = '1') АЮ 
((г1евЕ_ор(7) ХОВ гези1{8(7)) = '1')) «еп -- У Лав 


МО <= '1'; 
е15е 

У ОЛ <= '0'; 
епа 1+; 


В следующей таблице приведены результаты выполнения этого кода для четырех 
тестовых сценариев, указанных в вопросе: 


ей 1ей(7) | иоВКТ) | гези8 (СТ) | У ООТ 


он 
126 


Логика установки и обнуления флага \ для этих тестовых сценариев верна. 


Упражнение 4 


При пересылке данных через среду передачи, подверженную ошибкам, чтобы 
определить, были ли какие-либо биты данных потеряны или искажены во время 
передачи, обычно используется контрольная сумма. Она, как правило, добавляет- 
ся к переданной записи данных. В одном из алгоритмов расчета контрольной сум- 
мы используются следующие шаги: 


1. Сложение всех байтов в записи данных с сохранением только младших 8 бит 
суммы. 


2. Определение контрольной суммы, которая представляет собой дополнение до 
двух этой 8-битной суммы. 


3. Добавление байта контрольной суммы к записи данных. 


После получения блока данных с добавленной контрольной суммой процессор мо- 
жет определить правильность контрольной суммы простым сложением всех байтов 
в записи, включая контрольную сумму. Контрольная сумма является правильной, 
если младшие 8 бит суммы равны нулю. Реализуйте этот алгоритм контрольной 
суммы, используя язык ассемблера 6502. Байты данных начинаются с ячейки памя- 
ти по адресам $10-$11, а количество байтов (включая байт контрольной суммы) 
предоставляется в качестве входных данных в регистре Х. Установите для регистра 
А значение 1, если контрольная сумма является правильной, и значение 0 в ином 
случае. 
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Приложение 


Ответ. Файл Ех__4_сНескзит_а1в.азт содержит следующий код вычисления контроль- 
ной суммы: 


; Ех_4 спеск$ит_аЁ9.а$т 


; Попробуйте запустить этот код по адресу НЁЕр$: //$ КТ агТсК. ЧТЕРИЬ. 1о/еазуб502/ 


; Зададим массив байтов для Вычисления контрольной суммы 


ЕРА #$01 
ТА $00 


ГРА #$72 
$ТА $01 


ГОА #$93 
ЗТА $02 


ЕРА #$Е4 
ТА $03 


[РА #$06 ; Это байт контрольной суммы 
ТА $04 


; Сохраним адрес массива данных 6 $10-$11 
ГРА #$00 
ЗТА $10 
ТА $11 


; Сохраним количество байтов 6 Х 
ЕХХ #5 


; Зададим алгоритм вычисления контрольной суммы. 
; Переместим содержимое ХВ У 

ТХА 

ТАУ 


; Вычислим контрольную сумму 
ЕрА #$00 
ОЕУ 


ГООР: 
СЕС 
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АБС ($19), У 
ОЕУ 
ВРЕ ГООР 


СМР #$00 
ВМЕ ЕВККОВ 


; Сумма равна нулю: контрольная сумма верна 
ЕВА #1 
ЭМР БОМЕ 


; Сумма не равна нулю: контрольная сумма неверна 
ЕВКОК: 
БА #0 


; А содержит 1, если контрольная сумма верна, и 9, если она неверна 
ООМЕ: 


Упражнение 5 


Поместите код проверки контрольной суммы из упражнения 4 в помеченную под- 
программу, которую можно вызвать с помощью инструкции 258 и которая заверша- 
ется инструкцией вт5. 


Ответ. Файл Ех__5 сНесКзит_зибгоц1пе.азт реализует алгоритм вычисления кон- 
трольной суммы в виде подпрограммы: 


; ЕХ_5 спесЮ$ит_зибгои Тпе. ат 
; Попробуйте запустить этот код по адресу И®рз: //5КТЦагтск. дтЕРиь. 10о/еа5уб502/ 


; Зададим массив байтов для Вычисления контрольной суммы 
ГРА #$01 

$ТА $00 

(ФА #$72 

ЗТА $01 

ГОА #$93 

$ТА $02 

ГОА #$74 

ЗТА $03 

ЕДА #$06 ; Это байт контрольной суммы 
$ТА $04 


544 Приложение 


; Сохраним адрес массива данных 6 $10-$11 
ГОА #$00 
ТА $10 
ТА $11 


; Сохраним количество байтов 6 Х 
ОХ #5 


; Вызовем подпрограмму вычисления контрольной суммы 
3$В САЕС_СК$ИМ 


; Остановим Выполнение 
ВВК 


; Вычислим контрольную сумму 
САЁС_СК$УМ: 
; Переместим содержимое Х В У 


ЕООР: 
сес 

АБС ($10), У 
ОЕУ 

ВРЕ [ООР 


СМР #$00 
ВМЕ СК$УМ ЕККОК 


; Сумма равна нулю: контрольная сумма верна 
ЕФА #1 
ЭМР БОМЕ 


; Сумма не равна нулю: контрольная сумма неверна 
СКЗИМ_ЕВВОВ: 
РА #9 


Ответы к упражнениям 545 


; А содержит 1, если контрольная сумма верна, и 0, если она неверна 


ООМЕ: 
ВТ 


Упражнение 6 


Напишите и выполните набор тестов для проверки правильности работы подпро- 
граммы проверки контрольной суммы, которую вы создали в упражнениях 4—5. 
Какова длина самого короткого блока данных, для которого ваш код может выпол- 
нить проверку контрольной суммы? Какова длина самого длинного блока данных? 


Ответ. Файл Ех__6_спескзит +е5%$.азт содержит следующий код проверки контроль- 
ной суммы: 


; Ех_6 спесв5$ит те$ф5.а$т 
; Попробуйте запустить этот код по адресу ВЁЁр$: //$ЕТИагтсК. дТЕРиБ. 10/еазу6502/ 


; После завершения тестов: А=ЗАА, если проверка успешна; 
; А=ЗЕЕ, если обнаружена ошибка 


; Сохраним адрес массива данных 6 $10-$11 
ЕОА #$00 
ТА $10 
ЗТА $11 


ТЕ$ЗТ1: 


; Тест 1: 1 байт; контрольная сумма: 00. Тест должен быть пройден? Да 
ГРА #$00 
$ТА $00 


; Сохраним количество байтов 6 Х 
ОХ #1 


; Вызобем подпрограмму Вычисления контрольной суммы 
3$В САЁЕС_СК$ИМ 


СМР #$01 
ВЕО ТЕЗТ2 
ЭМР ЕВКОВ 
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; Тест 2: 1 байт; контрольная сумма: 01. Тест должен быть пройден? Нет 
ГОА #$01 
$ТА $00 


; Сохраним количество байтов в Х 
ЕОХ #1 


; Вызовем подпрограмму вычисления контрольной суммы 
3$ САЕС_СК$ИМ 


СМР #$00 
ВЕО ТЕЗТЗ 
ЭМР ЕККОК 


; Тест 3: 2 байта: 00; контрольная сумма: 00. Тест должен быть пройден? Да 
ГРА #$00 
ТА $00 
ТА $01 


; Сохраним количество байтов 6 Х 
ЕОХ #2 


; Вызовем подпрограмму бычисления контрольной суммы 
2$В САЕС_СК$ИМ 


СМР #$01 
ВЕО ТЕЗТ4 
ЭМР ЕВВОВ 


; Тест 4: 2 байта: 09; контрольная сумма: 01. Тест должен быть пройден? Нет 
ГОА #$00 
$ТА $00 
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[ФА #$01 
5ТА $01 


; Сохраним количество байтов 6 Х 
ЕОХ #2 


; Вызовем подпрограмму Вычисления контрольной суммы 
3$К САЁС_СК$ИМ 


СМР #$00 
ВЕО ТЕЗТЬ 
ЭМР ЕВКОК 


; Тест 5: 2 байта: 01; контрольная сумма: 00. Тест должен быть пройден? Нет 
ГОА #$01 

ТА $00 

ГРА #$00 

ЗТА $01 


; Сохраним количество байтов 6 Х 
ЬОХ #1 


; Вызовем подпрограмму вычисления контрольной суммы 
258 САЁС_СК$ИМ 


СМР #$00 
ВЕО ТЕЗТб 
ЭМР ЕКВОВ 


; Тест 6: 3 байта: 00 00; контрольная сумма: 00. Тест должен быть пройден? Да 
ГОА #$00 
ТА $00 
ЭТА $01 


ЗТА $02 
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; Сохраним количество байтов в Х 
ОХ #3 


; Вызовем подпрограмму вычисления контрольной суммы 
9$К САЕС_СКУИМ 


СМР #$01 
ВЕО ТЕЗТ7 
ЭМР ЕВКОВ 


; Тест 7: 3 байта: 00 00; контрольная сумма: 00. Тест должен быть пройден? Да 
ГОА #$00 

ТА $00 

ЗТА. $01 

$ТА $02 


; Сохраним количество байтов 6 Х 
ГОх #3 


; Вызовем подпрограмму вычисления контрольной суммы 
3$В САЁС_СК$ИМ 


СМР #$01 
ВЕО ТЕЗТ8 
ЭМР ЕККОК 


; Тест 8: 3 байта: 00 00; контрольная сумма: 01. Тест должен быть пройден? Нет 
тРА #$00 

$ТА $00 

ЕОА #$00 

ТА $01 


ГРА #$01 
ТА $02 


; Сохраним количество байтов 6 Х 
ОХ #3 
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; Вызобем подпрограмму Вычисления контрольной суммы 
9$В САЁС_СК$УМ 


СМР #$00 
ВЕО ТЕЗТЭ 
ЭМР ЕВКОК 


; Тест 9: 3 байта: 00 01; контрольная сумма: ЕР. Тест должен быть пройден? Да 
ГА #$00 

ТА $00 

ГОА #$01 

ЗТА $01 

ГРА #$ЕЕ 

5ТА $02 


; Сохраним количество байтов 6 Х 
ХХ #3 


; Вызовем подпрограмму вычисления контрольной суммы 
35$ САЁС_СК$ИМ 


СМР #$01 
ВЕО ТЕЗТ10 
ЭМР ЕВВОВ 


ТЕ$Т10: 


; Тест 10: 5 байтов: 01 72 93 Е4; контрольная сумма: 06 
; Тест должен быть пройден? Да 
ГОА #$01 


ТА $00 
ГОА #$72 
ЗТА $01 
ГОА #$93 
ТА $02 
(ФА #$Е4 
ЭТА $03 
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ГОА #$06 ; Это байт контрольной суммы 
ЗТА $04 


; Сохраним количество байтов 6 Х 
ЕОХ #5 


; Вызовем подпрограмму Вычисления контрольной суммы 
258 САЁЕС_СК$ИМ 


СМР #$01 
ВЕО РАЗ$ЕО 


; Произошла ошибка; останов выполнения со значением ЗЕЕ В А 
[РА #$ЕЕ 
ВКК 


1ОА #$АА 
ВВК 


; Вычислим контрольную сумму 
САЕС_СК$ИМ: 
; Переместим содержимое Х в У 


ГОР: 
скс 

АОС ($10), У 
ОЕУ 

ВРЕ ГООР 


СМР #$00 
ВМЕ СК$УМ_ЕВКОК 
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; Сумма равна нулю: контрольная сумма верна 
ЕФА #1 
ЭМР БОМЕ 


; Сумма не равна нулю: контрольная сумма неверна 
СКЗИМ_ЕВВОВ: 
ГОА #9 


; А содержит 1, если контрольная сумма верна, и 0, если она недерна 
ООМЕ: 
ВТ$ 


Данная процедура вычисления контрольной суммы работает для последовательно- 
стей длиной от | до 255 байт. 


Глава 4. Компоненты компьютерной системы 


Упражнение 1 


Создайте схему реализации логического элемента И-НЕ, используя две пары 
МОП-транзисторов, объединенных в КМОП-структуры. В отличие от схем венти- 
лей на основе я-р-п-транзисторов, для этой схемы не требуются резисторы. 


Ответ. Эта схема выглядит так, как представлено на рис. ПЗ. 


Рис. ПЗ. Схема вентиля И-НЕ 
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Упражнение 2 


16-гигабитная интегральная схема памяти ОКАМ имеет два входа выбора группы 
банков, два входа выбора банка и 17 входов выбора адресов строк. Сколько битов в 
каждой строке банка в этом устройстве? 


Ответ. Эта схема памяти ОВАМ содержит 16 гигабит = 16 х 2 бит. 


Количество битов адреса = 2 бита группы банков + 2 бита банка + 17 битов адреса 
строки =21 бит. Следовательно, размер строки каждого банка равен 
(16х22): 2? = 8192 бита. 


Глава 5. Аппаратно-программный интерфейс 


Упражнение 1 


Перезагрузите компьютер и войдите в раздел настроек ВОЗ или ОЕЕТ. Изучите 
каждое из доступных в этом разделе меню. Какую систему использует ваш компь- 
ютер, В1О$ или ЧЕЕГ? Поддерживает ли ваша материнская плата разгон процессо- 
ра? Когда закончите, обязательно выберите вариант выхода без сохранения изме- 
нений, если только вы не обладаете полной уверенностью в том, что хотите внести 
изменения. 


Ответ. В \!пдоу/з вы можете войти в раздел настроек ВОЗ/ОЕЕ! путем изменения 
параметров запуска во время работы \/тдо\5. Для того чтобы получить доступ к 
этим настройкам, выполните следующие действия: 


1. В окне поиска \Мтдо\з введите з+агфир и выберите Свапре адуапсед %агир 
орНоп$ (Изменение расширенных параметров запуска). 


2. Щелкните на кнопке Везёаг по\у (Перезагрузить сейчас) в разделе Адуапсед 
%агир (Особые варианты загрузки). 


3. При появлении запроса СВоо0зе ап орНоп (Выберите вариант) выберите 
Тгоце$Воо*{ (Устранение неполадок). 


4. На экране Тгоие$Воо{ (Устранение неполадок) выберите Адуапсед орйоп$ 
(Дополнительные параметры). 


5. На экране Адуапсе4 орНоп$ (Дополнительные параметры) выберите ОЕЕТ 
Ешгтууаге Зе тр$ (Параметры встроенного ПО ЧЕР!]). 


6. На экране ОЕЕТ Ейтуаге Зе{Итр$ (Параметры встроенного ПО ЦЧЕЕГ) щелкни- 
те на кнопке Везваг{ (Перезапустить). 


7. Система перезагружается и отображает главный экран настройки ОЕЕГ. Исполь- 
зуйте клавиши со стрелками влево и вправо на клавиатуре для перемещения ме- 
жду экранами. 
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Следующие пункты содержат ответы на вопросы этого упражнения для конкретной 
компьютерной системы (в данном случае это ноутбук Аза ДепВоок ОХЗОЗГА): 


1. В сообщениях, отображаемых в меню, часто используется термин "ВОЗ", одна- 
ко упоминания о "приложениях ЕН!" и датах их выпуска указывают на то, что на 
самом деле это 9ЕЕГ. 


2. Никакие варианты разгона не предусмотрены. 


После завершения изучения информации ОЕЕГ выполните выход без сохранения 
каких-либо изменений с помощью следующих действий: 


1. Перейдите на страницу Зауе & ЕхИ (Сохранить и закрыть). 


2. Используйте клавиши со стрелками вверх и вниз, чтобы выбрать вариант 
О/5сага Свапое$ апа Ехй (Отменить изменения и выйти). 


3. Нажмите клавишу <Ещег>. 


4. Выберите Уез (Да) и нажмите клавишу <Емег> при отображении окна Ехй 
У ПоцЕ Зауше (Выход без сохранения). 


5. Система перезагружается. 
Упражнение 2 


Выполните соответствующую команду на компьютере, чтобы отобразить инфор- 
мацию о текущих запущенных процессах. Какой идентификатор Ргосез$ Ш (РФ) 
имеет процесс, который вы используете для выполнения этой команды? 


Ответ. В У/тдо\$ откройте окно командной строки (чтобы найти это приложение, 
введите соттапа в строке поиска \!ш4о\5) и введите команду +а$К115{: 


С: \>Еа$К11$% 
Ттаре Мате 5е5$1ой Маме 5е$$101# Мет заре 


буфет Т91е Ргосе5$ 5ег\1се$ 


буфет 5ег\у1се$ 


Вер1${гу | 5ег\у1се$ 


$155 .ехе 5ег\у1се$ 
с$г$$.ехе $егу1се$ 
и11111*.ехе Зег\/1се$ 
зег\у1се$.ехе 5ег\у1се$ 
15а$5$.ехе $ег\у1се$ 


<усПо$Е.ехе Зег\у1се$ 


фо зоо ое 
жж лххлхллхх 


$усНо$*.ехе $ег\у1се$ 
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<усНо$ф.ехе 12184 Зегутсез 


ста .ехе 16908 Соп5о]е 
сопро$*.ехе 21712 Сопзо]1е 18,448 К 


{а$К11$%.ехе 15488 Соп5о]е 3 19,096 К 


Текущий процесс — это тот, который запускает приложение +а$К115*.ехе. Иденти- 
фикатор (РТО) этого процесса — 15488. 


Глава 6. Специализированные вычисления 


Упражнение 1 


Частотно-монотонное планирование (ВМ$) — это алгоритм назначения приори- 
тетов потокам в приложениях жесткого реального времени с вытеснением, в кото- 
рых потоки выполняются периодически. КМ$ назначает наивысший приоритет по- 
току с самым коротким периодом выполнения, следующий по значимости 
приоритет — потоку со следующим наиболее коротким периодом выполнения и 
т. д. Система ВМ$ является диспетчеризуемой, т. е. все ее задачи гарантированно 
укладываются в установленные сроки (при условии, что межпоточные взаимодей- 
ствия или другие действия, такие как прерывания, не вызывают задержек обработ- 
ки), если выполняется следующее условие: 


У“ «(2 -1). 


1= 2; 


Эта формула выражает максимальную долю доступного времени обработки, КОТО- 
рое может быть потрачено п потоками. В этой формуле С; — это максимальное 
время выполнения, необходимое для потока /, а Т; — период выполнения потока 1. 


Является ли следующая система, состоящая из трех потоков, диспетчеризуемой? 


О ОЕ ООО ОЕ И 
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Ответ. Прежде всего оценим левую часть формулы ВМ$, используя данные из таб- 


лицы: 


50.100, 120 
100 500 1000 


Затем оценим правую часть формулы КМ$: 
3.(2'° -1)=0,7798. 


Так как 0,82 не меньше и не равно 0,7798, этот набор задач не является диспетчери- 
зуемым в системе КМ. 


Упражнение 2 


Широко используемая форма одномерного дискретного косинусного преобразо- 
вания (ДКП) выражается следующей формулой: 


М-1 д | 
Хх, =Ух, с0$| —| и+- К | 
р № 2 
В этой формуле К, индекс коэффициента ДКП, меняется от 0 до М- 1. Напишите 
программу для вычисления ДКП такой последовательности: 

х = {0.5, 0.2, 0.7, -0.6, 0.4, -0.2, 1.0, -0.3}. 


Косинусные члены в формуле зависят только от индексов п и Ки не зависят от по- 
следовательности входных данных х. Это означает, что косинусные члены можно 
вычислить один раз и сохранить в виде констант для последующего использования. 
Если сделать это в качестве подготовительного этапа, то вычисление каждого ко- 
эффициента ДКП сводится к последовательности операций МАС. 


Эта формула представляет собой неоптимизированную форму вычисления ДКП, 
требующую № итераций операции МАС для вычисления всех коэффициентов ДКП 
в количестве М. 


Ответ. Файл Рушоп Ех __2_4с_Фогти1а.ру содержит код вычисления ДКП: 
#1/изг/БТп/епу ру роп 


"""Ех__2_Ас*_+огтиу1а.ру: ответ на упражнение 2 главы 6.""" 


# Выходные данные, формируемые этой программой: 

# Индекс [2) 1 2 3 4 5 6 7 
#х 9.5000 0.2000 0.7000 -0.6000 0.49000 -0.2000 1.0000 -0. 3000 
# ОСТ(х) 1.7000 0.4244 0.6374 0.4941 -1.2021 0.5732 -0.4936 2.3296 


1трог{ таеВ 
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# Входной вектор 
х = [0.5, 0.2, 0.7, -0.6, 0.4, -0.2, 1.0, -0.3] 


# Вычислим коэффициенты ДКП 
се соеф = [[1 ог 1 1т гапве(1еп(х))] ог } 1п гапве(1еп(х))] 
Фог п 1 гапее(1еп(х)): 
ог К 1т гапве(1еп(х)): 
дс*_ сое+[п][К] = мафВ.со$ ( (таеВ.р1/1еп(х))*(п + 1/2)*К) 


# Вычислим ДКП 
х_Дс* = [1 Рог 1 1т гапее(1еп(х))] 
фог К Зт гапве(1еп(х)): 
х АСЕ[К] = 0; 
фог п 1т гапве(1еп(х)): 
х_АСЕ[К] += х[п]*ас& сое [п] [К] 


# Выдедем результаты 

рг1п*( 'Индекс', епд='') 

ог 1 1п гапве(1еп(х)): 
рг1тЕ( "#84" % 1, епа='') 


рг1п* ( '\пх ', епд='') 
Фог 1 1п гапве(1еп(х)): 
рг1п*("%8.4+" % х[1], епа='') 


рг1пЕ('\пОСТ(х) ', епа='') 
Фог 1 1т гапве(1еп(х)): 
рг1п*("%8.4+" Х х_4с*[1], епа='') 


Для того чтобы запустить код при условии, что РуШоп установлен и находится по 
известному системе пути, выполните следующую команду: 


рубНоп Ех__2_@ас& ФогтиТа.ру 


Ниже показаны выходные данные, формируемые программой: 


С:\>Ех__2_ас® Фогту1а.ру 
Индекс а 1 2 3 д 5 6 7 


х 9.5000 09.2000 0.7099 -0.6000 0.4990 -0.2000 1.9000 -0.3000 
ОСТ(х) 1.7000 0.4244 0.6374 09.4941 -1.2021 0.5732 -0.4936 2.3296 
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Упражнение 3 


В качестве функции активации в искусственных нейронных сетях (агЯйаа| 
пеига! пебуогк, АММ) часто используется гиперболический тангенс. Его функция 
определяется следующим образом: 
х —х 
ге’ —е 
и (х) ==. 

е’ +е 
Дан нейрон с входами от трех предшествующих нейронов, показанный на рис. 6.4. 
Вычислите выходной сигнал нейрона с гиперболическим тангенсом в качестве 
функции активации Р(х), используя следующие выходные сигналы нейронов и веса 
соответствующих путей: 


Ответ. Файл Руфоп Ех __3 асЕ1ма1оп_+ипс.ру содержит следующий код: 


#!Иизг/бтп/епу ру Йоп 
"""Ех__З_ас1уа1юоп_Фипс.ру: ответ на упражнение 3 главы 6.""" 


# Выходные данные, формируемые этой программой: 
# Выходное значение нейрона = -0.099668 


1трог® тафИ 
# Векторы сигнала и веса нейрона 


пеигоп = [9.6, -0.3, 0.5] 
[0.4, 0.8, -0.2] 


метр 
5ит = @ 
Фог 1 1 гапре(1еп(пеигоп)): 

ит = ит + пеигоп[1] * ме1ей[1] 


ОифриЕ = мафП.Жапй (зим) 


# Вывод результатов 
рг1п*('Выходной сигнал нейрона = #8.6+' % оцЕри{ф) 
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Для того чтобы запустить код при условии, что Ру@оп установлен и находится по 
известному системе пути, выполните следующую команду: 


ру{Поп Ех__3 ас 1уа1оп_Фипс.ру 


Ниже показаны выходные данные, формируемые программой: 


С:\>Ех__3 ас1уа&1от Фипс.ру 


Выходной сигнал нейрона = -9.099668 


Глава 7. Архитектура процессоров и памяти 


Упражнение 1 


16-разрядный встраиваемый процессор имеет отдельные области памяти для кода и 
данных. Код хранится во флеш-памяти, а изменяемые данные — в оперативной па- 
мяти. Некоторые значения данных, такие как константы и начальные значения для 
элементов данных оперативной памяти, хранятся в той же области флеш-памяти, 
что и инструкции программы. ОЗУ и ПЗУ находятся в одном адресном пространст- 
ве. Какая из архитектур процессоров, рассмотренных в главе 7, лучше всего описы- 
вает этот процессор? 


Ответ. Поскольку код и данные расположены в одном и том же адресном про- 
странстве, это архитектура фон Неймана. 

Тот факт, что код и некоторые элементы данных хранятся в ПЗУ, а другие элемен- 
ты данных находятся в ОЗУ, не имеет отношения к определению категории архи- 
тектуры. 


Упражнение 2 


Процессор, описанный в упражнении [, имеет функции защиты памяти, которые не 
позволяют исполняемому коду изменять память инструкций программы. Для дос- 
тупа к инструкциям и данным этот процессор использует физические адреса. Со- 
держит ли он блок управления памятью (ММО)? 


Ответ. Защита областей памяти является функцией ММО, однако наличие защиты 
памяти само по себе не означает, что используется ММУ. Этот процессор не со- 
держит ММЦ. 


ММО обычно выполняют трансляцию виртуальных адресов в физические, что в 
описанном здесь процессоре не предусмотрено. 
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Упражнение 3 


Порядок доступа к последовательным элементам в большой структуре данных мо- 
жет оказать ощутимое влияние на скорость обработки из-за таких факторов, как 
повторное использование записей буфера ТГВ. Последовательный доступ к отда- 
ленным элементам массива (это элементы, находящиеся за пределами страничного 
кадра, где размещены ранее запрошенные элементы) требует частых мягких отка- 
зов страниц по мере загрузки новых записей ТЁВ и удаления старых. 


Напишите программу, которая создает большой двумерный массив чисел, напри- 
мер на 10 000 строк и 10 000 столбцов. Выполните итеративный обход массива в 
порядке возрастания столбцов, подписывая каждый элемент суммой индексов 
строки и столбца. Доступ по столбцам означает, что индекс столбца увеличивается 
быстрее всего. Другими словами, индекс столбца увеличивается во внутреннем 
цикле. Точно измерьте время, которое занимает эта процедура. Обратите внимание, 
что вам может потребоваться принять меры для того, чтобы ваш язык программи- 
рования не исключил при оптимизации весь этот расчет из-за того, что результаты 
работы с массивом не используются в дальнейшем. Может быть достаточно вывес- 
ти одно из значений массива после завершения отсчета времени или же может по- 
требоваться сделать что-то вроде суммирования всех элементов массива и вывода 
этого результата. 


Повторите процесс, включая измерение времени, точно так же, как было описано 
ранее, только измените внутренний цикл на итерацию по индексу строки (первый 
индекс), а внешний цикл — на итерацию по индексу столбца, сделав последова- 
тельность доступа построчной. 


Во время выполнения вашего кода компьютеры общего назначения выполняют 
множество других задач, поэтому, чтобы получить статистически достоверный ре- 
зультат, вам может понадобиться выполнить обе процедуры несколько раз. Для на- 
чала можно провести эксперимент 10 раз и усреднить время доступа к массиву по 
столбцам и по строкам. 


Можете ли вы определить метод доступа к массиву, постоянно дающий лучший 
результат? Какой порядок является самым быстрым в вашей системе при использо- 
вании выбранного вами языка? Следует учитывать, что разница между методами с 
порядком доступа по столбцам и по строкам может быть не слишком значитель- 
ной — она может составлять всего несколько процентов. 


Ответ. Файл Ех __3_гом со1итп_маог_огаег.ру содержит следующую реализацию ре- 
шения этого упражнения на языке Рушоп: 


#!Иизг/Ьтп/епу ру{Поп 


"""Ех__3 гом_со]итп_та]ог_огаег.ру: ответ на упражнение 3 главы 7. 


# Типичный результат выполнения этого сценария: 
# среднее время доступа по строкам: 16,68 с 
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# среднее время доступа по столбцам: 15,94 с 
# средняя разница по времени: 9, 74 с 
# победитель - индексация по столбцам; она быстрее на 4,42% 


1трог® {1те 


91т = 10000 
мафг1х = [[9] * ат] * дм 


пуп ра$5е$ = 10 
гом_тауог_1те = @ 
со1_мауог_+1те = 9 


тог К 1п гапре(пит раз$е$): 
рг1пЕ(‘ Проход ЖА из ХА:' Х (К+1, пит ра5$е$)) 


+0 = +1те.Е1те() 
фог 1 1п гапве(41т): 
ог ) 1п гапее(а1т): 


маг1х[1][3] =1+) 
+1 = &1те.&1те() 


фота] _{1те = +1 - +9 

со1_мауог_+1те = со] та)ог Е1те + +о+фа1 _%1те 

рг1п*(' Время заполнения массива по столбцам: %.2+ с' % 
{ф0фа1_+1те) 


{9 = Е1те.Е1те() 
ог 1 1п гапве(91т): 
Фог ) 1т гапре(91т): 
мафг1х[7][1] =1+93 


{1 = +11те.в1те() 


фофа1_%1ще = %1 - 19 
гом_тауог_+1те = гом тадог +1те + Кока] _+1те 
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рг1п*(' Время заполнения массива по строкам: %.2+ с' % 
фота] _+1те) 
рг1пЕ('') 


гом_та]ог_ауегаре = гом та3Зог_+1те / пит_ра$5ез 


с0о1_та)ог_ауегаре = со] мта)]ог %1те / пит ра$$е$ 


1+ (гом тадог_ауегаре ‹ со] тафог_ауегаве): 
м1ппег = ‘'строкам' 
рс& Бе{фег = 100 * (со1 тадог_ауегаре - 
гом та)ог ауегаре) / со] та]ог_ауегаве 
е1зе: 
м1ппег = 'столбцам" 
рсЕ Беффег = 100 * (гом та]ог_ауегаее - 
со] _та)ог_ауегаре) / гом та)ог_ауегаре 
рг1пе( 'Среднее время доступа по строкам: %.2+ с' % гом_та)]ог_ауегаве) 
рг1п* ("Среднее время доступа по столбцам: %.2+ с’ % со1_та)ог_ауегаве) 
рг1пЕ( 'Средняя разница по времени: #.24 с'® ( 
(гом_тазог_+1те-со]_та)ог_ +1те) / пит_ра55е$)) 


рг1п*( ('Победитель: индексация по ' + м1ппег + 


'; она быстрее на %.2+%%') % рсЕ Бе\ег) 


Выполнение этой программы на ПК с У/тдо\з занимает несколько минут. Ниже 
показаны типичные выходные данные, отображаемые при запуске этой программы. 


Среднее время доступа ‘по строкам: 16.68 с 


Среднее время доступа по столбцам: 15.94 с 
Средняя разница по времени: 0.74 с 


Победитель: индексация по столбцам; она быстрее на 4.42% 


Глава 8. Методы повышения производительности 


Упражнение 1 


Рассмотрим 1-кеш Г.1 с прямым отображением размером 32 Кбайт. Каждая строка 
кеша состоит из 64 байт, а системное адресное пространство составляет 4 Гбайт. 
Сколько битов отведено для тега этого кеша? Биты с какими номерами (бит 0 — 
наименее значимый бит) составляют адресное слово? 


562 Приложение 


Ответ. Кеш содержит 32 768 байт по 64 байта в каждой строке. Количество наборов 
в кеше: 32 768 : 64 = 512. 512 = 2°. Таким образом, номер набора имеет длину 9 бит. 


Каждая строка кеша содержит 64 (2°) байта. Это означает, что младшие 6 бит каж- 
дого адреса представляют смещение байта в строке кеша. 


Для адресного пространства объемом 4 Гбайт требуются 32-разрядные адреса. Вы- 
читание 9 бит номера набора и 6 бит смещения байта из 32-разрядного адреса дает 
32 - (9+6) = 17 бит в теге кеша. 


Тег кеша находится в 17 старших битах адреса, поэтому эти биты в 32-разрядном 
адресе занимают область от бита 15 до бита 31. 


Упражнение 2 


Рассмотрим 8-канальный наборно-ассоциативный кеш инструкций и данных Г.2 
объемом 256 Кбайт с 64 байтами в каждой строке кеша. Сколько наборов использу- 
ется в этом кеше? 


Ответ. Количество строк в кеше равно 262 144: 64 = 4096. 


Каждый набор содержит 8 строк. 


Количество наборов = 4096 строк : 8 строк в наборе = 512 наборов. 


Упражнение 3 


Процессор имеет 4-этапный конвейер с максимальными задержками 0,8; 0,4; 0,6 и 
0,3 нс на этапах 1-4 соответственно. Если первый этап заменить двумя этапами с 
максимальными задержками 0,5 и 0,3 нс, соответственно, насколько увеличится 
тактовая частота процессора в процентном выражении? 


Ответ. Максимальная тактовая частота определяется самым медленным этапом 


конвейера. Самый медленный этап 4-ступенчатого конвейера занимает 0,8 нс. Мак- 
симальная тактовая частота равна: 


1: (0,8 х 10?) = 1,25 ГГц. 


Самый медленный этап 5-ступенчатого конвейера занимает 0,6 нс. Максимальная 
тактовая частота равна: 


1: (0,6х 10°) = 1,667 ГГц. 
Увеличение тактовой частоты в результате добавления этапа конвейера составляет: 
100 х (1,667 х 10° — 1,25 х 10°) : (1,25 х 10?) = 33,3%. 
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Глава 9. Специализированные 
расширения процессоров 


Упражнение 1 


Используя язык программирования, который предоставляет доступ к байтовому 
представлению типов данных с плавающей запятой (например, С или С++), напи- 
шите функцию, которая принимает в качестве входных данных 32-битное значение 
одинарной точности. Извлеките знак, порядок и мантиссу из байтов этого значения 
с плавающей запятой и выведите их на устройство отображения. Удалите смещение 
из порядка перед выводом его значения и выведите мантиссу в виде десятичного 
числа. Протестируйте программу на значениях 0, -6, 1, -1, 6.674е-11, 1.0е38, 1.0ез9, 
1.0е-38 и 1.0е-39. Перечисленные здесь числовые значения, содержащие е, исполь- 
зуют текстовое представление чисел с плавающей запятой на языке С/С++. Напри- 
мер, 6.674е-11 означает 6,674 х 107". 


Ответ. Файл С++ Ех__1_+1оа*_+огтае.срр содержит код для этого упражнения: 


// Ех_1_ПоаЕ Гогтат.срр 


#1тс1иае <1о$геат> 
#1пс1иде <с5а1пе> 


у014 рг1п*_11оа*(+1оа{ +) 
{ 


соп$+ аифо Буфе$ = 5%а1с_са$&<и1п8 _4*> (5%а1с_са$*<\о1а*>(&Е)); 
рг1п#(" Р1оае | %96 | ", +); 


Фог (1п 1 = $1хе0*(Е1оа®) - 1; 1 >= 0; 1-- 
рг1пЕ#("%02Х", Буке$[1]); 


ргапЕ#(" |"); 


соп$ ацфо $1еп = Буе$[3] >> 7; 

соп$ф ацфо ехропепе = (($Фа*1с_са$*<и1т16_+>(Буке$[3] & @х7Е) 
<< 8) | Буе$[2]) >> 7; 

аифо ехр_ипб1азе = ехропеп{ - 127; 


и11{32_+ тап{15$а = 0; 
фог (амо 1 = 0; 1< 3; 1++) 


тап{1$за = (тапе1$за << 8) | Бу&е$[2 - 1]; 
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тап1$5а &= @х7ЕЕРЕЕР; // Обнулим старший бит 


доиБ]Ле тап1$за_4ес; 
1+ (ехропепе == 0) // Этю ноль или денормализованное число 
{ 
тап*155а_4ес = тапе1$5а / $фа1‹с_са$‹<4они61е>(@х800000) ; 
ехр ип1а$е4++; 


} 
е15е 
тап{1$5а_4ес = 1.0 + тап1$5а / $х%а%1<с_саз*‹<доч61е>(@х800000); 
рг1пЕ+(" Ха | Ж%а | Ж\+\п", зп, ехр_ипЬ1азед, тапе1$5а_4ес); 
та1п(\014) 
реп Е+(" Тип | Число | Байты | Знак | Порядок | Мантисса\п"); 
ргзи+(" ------- |----------- |------------------ |------ |---------- |--------- \п"); 


рг1п*_41оа*(@); 

рг1п*_+1оа*(-0); // Знак "минус" игнорируется 

рг1пЕ +1оа*(1); 

рг1пЕ_{1оа*(-1); 

рг1пе_#1оа*(6.674е-11+); 

рг1пЕ +1оа*(1.0е38+); 

И/рглпЕ_Ёоа*(1.0е39$}); // Ошибка во время компиляции 
рг1п*_+1оа*(1.0е-38+); 

рг1п*_+1оа*(1.09е-39+); 


гефигп 0; 


Ниже показаны выходные данные программы: 


Мантисса 


90900999 . 0.900908 


99990999 0.099909 
35800009 1.090900 
В-800000 1.000000 
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Е1оае | 6.674е-11 
Е] оае 1е+38 


2Е92С348 | 1.146585 
7Е967699 | 1.175494 


| 
| | 

Е1оа® | 1е-38 | ООбСЕЗЕЕ | 0.850706 
| | 


Е] оа* 1е-39 000АЕЗ98 | 0.985071 


К этим результатам есть несколько примечаний. 


1. 


Ноль в 1ЕЕЕ 754 может иметь положительный или отрицательный знак. Нулю, 
передаваемому в функцию рг1п*_+1оа* во второй строке таблицы, предшествует 
знак "минус", но этот знак игнорируется при преобразовании в число с плаваю- 
щей запятой. 


Значение 1.0езэ9+ не отображается, поскольку его использование вызывает ошиб- 
ку во время компиляции: эта константа с плавающей запятой находится вне до- 
пустимого диапазона. 


Ноль представлен в виде мантиссы, равной нулю, и смещенного порядка, равно- 
го нулю. 


Последние две строки содержат числа, которые не могут быть представлены 
с неявным начальным битом | из-за отрицательного переполнения. Эти числа 
называются денормализованными и содержат специальный смещенный поря- 
док относительно 0. Денормализованные числа имеют пониженную точность, 
т. к. не все биты их мантиссы содержат значимые цифры. 


Численно денормализованные числа с плавающей запятой фактически исполь- 
зуют смещенный показатель, равный 1, который переводится в несмещенный 
порядок, равный —1[26. 


Упражнение 2 


Измените программу из упражнения 1, чтобы она могла также принимать значение 
с плавающей запятой двойной точности и выводить знак, порядок (с удаленным 
смещением) и мантиссу этого значения. Протестируйте ее с теми же входными зна- 
чениями, что и в упражнении [, а также со значениями 1.06368, 1.0е309, 1.0е-308 и 
1.0е-309. 


Ответ. Файл С++ Ех__2_доч61е_+огта*.срр содержит код для этого упражнения: 


// ЕХ_2_аочЫе рогта®.срр 
#1пс]и4е <105%геат> 
ис1иае <с$%а1пт*> 


\014 рг1пе 1оа*(+1оа* +) 
{ 


соп5$Е аико Буке$ = 5$а1с_са$‹и1п{8_1*>($Фа{1<_са${<\о14*> (&+)); 
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рг4пЕ+(" Р1оае | %9в | “, +); 


Фог (11% 1 = $12е0+(+]оа*) - 1; 1 >= 0; 1--) 
рг1пЕЕ("%02Х", Буфе$[1]); 


ре" (" |"); 


соп$Е ауфо $16п = Бу&е$[3] >> 7; 

соп$ф аибо ехропепе = (($%а%1с_са$&‹и1т*16_+>(Буез[3] & @х7Е) 
<< 8) | Буе$[2]) >> 7; 

ауфо ехр_ипЬ1азе = ехропеп* - 127; 


и1п32_+ тапЁ1$$а = 0; 
Ффог (ацфо 1 = 90; 1 < 3; 1++) 
тап{1$$а = (тап1$5а << 8) | Буе$[2 - 1]; 


тап{1$5а &= @х7РЕЕЕЕ; // Обнулим старший бит 


доу61е тапЕ1$5а_4дес; 
1+ (ехропепе == 0) // Это ноль или денормализованное число 
{ 
тап*1$за_4ес = тап1$5а / $+а%1с_са$*<дои1е>(0х800000) ; 
ехр_ипЬ1азед++; 
} 


е]5е 


тапе1$за_4ес = 1.0 + тап155а / $+а1с_са$<40и61е>(0х800000) ; 


рг1пе+(" а | №4 | Ж4\п", $46п, ехр_ипЬЗазе4, тапе1$5а_4ес); 


\014 рг1пе_ доче (доиб1е а) 


{ 


соп${ ацфо Буве$ = $а1с_саз${«и1п18_+*>($та4с_са$%<\уо19*>(8а)); 


ргАпЕ+(" Боциб1е | %9в |", 9); 


Фог (11% 1 = $12е0+(доц ]е) - 1; 1 >= 0; 1--) 
рг1п+("%02Х", Буке$[1]); 


рг4пе+(" | "); 


Приложение 
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1т% 


соп${ ацфо $1еп = Буе$[7] >> 7; 

соп$+ ацко ехропепе = (($фа{1с_са$‹и1п{16 +>(Буве$[7] & @х7Е) 
<< 8) | БУе$[6]) >> 4; 

аифо ехр_ипЬ1азед = ехропеп* - 1023; 


11664 Е тапЕ1$5а = 0; 
Фог (ачфо 1 =0;1<7; 1++) 
мапе1$5а = (тапЕ1$хза << 8) | Буе$[6 - 1]; 


тап{1$5а &= @хЕРЕРЕЕЕЕЕЕЕЕЕ; // Сохраним младшие 52 бита 
доч6]е тап{1$5а_4ес; 
1+ (ехропепе == @) // Это ноль или денормализованное число 


{ 
тапе155а_4ес = мап{155а / °%а1с_саз$*+‹доч61е>(0х100000е00000е0) ; 
ехр_ипЬ1азеа++; 

} 

е15е 


тапе155а_4ес = 1.0 + тапЕ1$$а / 5%а&1с_саз‹адои1е>(@х10000000000009) ; 


ргатЕ(" %а | %5а | %1*%\п", $4еп, ехр_ипб1азед, тапе155а_4ес); 


ма1п(уо1а) 
риг1п+(" Тип | Число | Байты | Знак | Порядок | Мантисса \п"); 
ргапе+(" ------ |----------- [------------------ |------ |---------- |---------- \п"); 


рг1пе_+1оа*(9); 

рг1п®_+1оа*(-9); // Знак "минус" игнорируется 
рг1пе_+1оа*(1); 

рг1п_+1оа*(-1); 

рг1п*_+1оа*(6.674е-11+); 

рг1п*_+1о0а*(1.@е38+); 

//рг1пе_+1оа*(1.0е39+); // Ошибка во время компиляции 
рг1пе_+1оа*(1.0е-38+); 

рг1пе_+1оа*(1.0е-39+); 


рг1п®_9ои61е(0); 
рг1п_@оч61е(-0); // Знак "минус" игнорируется 
рг1п=_аоч61е(1); 
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рг1п*_доу61е(-1); 

рг1п*_@ои61е(6.674е-11); 

рг1пЕ_4оц61е(1.6@ез38); 

рг1пе_4оу61е(1.0ез9); 

рг1п*_аочц1е(1.0е-38); 

рг1п*_аоч1е(1.@е-39); 

рг1п_дои61е(1.0е308); 

//рг1пе_доч61е(1.0е309); // Ошибка во время компиляции 
рг1пЕ_дои61е(1.@е-368); 

рг1п*_4оцЬ1е(1.@е-309); 


гефигп 0; 


Ниже показаны выходные данные программы: 


Мантисса 


09090999 
90000999 
3Е800000 
В-800000 
2Е92С348 
7Е967699 
@06СЕЗЕЕ 
990АЕЗЭ8 
бочб]е | оовово9вов9вов0в 
Боиб1е 09900099000000990 
боцб1е 2.251 2252512121515121515] 
боиб]е ВЕЕ9000000000000 
боиб1е | 6.674е-11 |. 30025868Е40ЕАЕ1б 
боч61е 1е+38 | 4702СЕ032А16А1В1 
боиб1е 1е+39 | 48078287Е49С4А1О 
Роб] е 1е-38 | З80В3З8ЕВЭБАА78Е4 
Боиб1е 1е-39 | 3705С72ЕВ1552083 
Боиб1е 7ЕЕЗССЕЗ85ЕВС8АО 
Бои] е 9099730067819Е802 
боиб]1е 9009088157268 Е)АЕР 


62.2.2221] 
. 0090000 
. 000000 
. 009098 
.146585 
.175494 
.850706 
. 085071 
. 000090 
. 090090 
.909900 
. 0000080 
. 146584 
.175494 
.469368 
. 701412 
.361129 
.112537 
.449423 
. 944942 


9 
а) 
9 
1 
9 
9 
9 
|2) 
9 
9 
9 
1 
в. 
9 
9 
9 
@ 
9 
9 
9 


вон нене нь нноооонннноо>ь 
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К этим результатам есть несколько примечаний. 


1. Ноль в ТЕЕЕ 754 может иметь положительный или отрицательный знак. Нулю, 
передаваемому в функцию рг1пе_доиб]е во второй строке таблицы, содержащей 
тип доиб]е, предшествует знак "минус", но этот знак игнорируется при преобра- 
зовании в число с плавающей запятой. 


2. Значение 1.0е309 не отображается, поскольку его использование вызывает ошиб- 
ку во время компиляции: "фе НоаНпр соп$апе 1$ оиё оЁ гапре" ("константа с пла- 
вающей запятой находится вне допустимого диапазона"). 


3. Ноль представлен в виде мантиссы, равной нулю, и смещенного порядка, равно- 
го нулю. 


4. Последние две строки содержат числа, которые не могут быть представлены 
с неявным начальным битом 1 из-за отрицательного переполнения. Эти числа 
называются денормализованными и содержат специальный смещенный поря- 
док относительно 0. Денормализованные числа имеют пониженную точность, 
т. к. не все биты их мантиссы содержат значимые цифры. 


5. Численно денормализованные числа с плавающей запятой двойной точности 
фактически используют смещенный показатель, равный 1, который переводится 
в несмещенный порядок, равный —1022. 


Упражнение 3 


Найдите в Интернете информацию о семействе процессоров 1.МХ ВТ1060 компа- 
нии МХР Зеписопдисюг$. Скачайте технические описания этого семейства и от- 
ветьте на следующие вопросы об этих процессорах. 


Ответ. Вводная информация о семействе процессоров 1.МХ ВТ1060 доступна по 
адресу В р$://\у\у\.пхр.сот/40с$/еп/пхр/дайа-зВееЛМХКТ1060СЕС.р9Е. 


Полное справочное руководство по 1.МХ КТ1060 доступно только после создания 
учетной записи по адресу Вр$://\му\у\.пхр.сот. 


После входа в свою учетную запись выполните поиск строки 1.МХ ВТ1060 Ргосе$$ог 
Кеегепсе Мапиа1, чтобы найти справочное руководство и скачать его. Имя файла — 
ТМХАТ1е60ВМ.ра+. 


Упражнение 4 


Поддерживают ли процессоры 1.МХ ВТ1060 концепцию выполнения инструкций в 
режиме супервизора? Объясните свой ответ. 


Ответ. Поиск по слову зирег\15ог в справочном руководстве по процессору 1.МХ 
ВТ!060 дает несколько подсказок. Однако все эти варианты использования отно- 
сятся к ограничениям доступа, связанным с конкретной подсистемой, такой как 
модуль НехСАМ. 


570 Приложение 


Режим супервизора в процессоре 1.МХ КТ1060 не работает на уровне выполнения 
инструкций, т. е. эти процессоры не реализуют выполнение инструкций в режиме 
супервизора, согласно описанному в главе 9. 


Упражнение 5 


Поддерживают ли процессоры 1.МХ КТ1060 концепцию виртуальной памяти со 
страничной организацией? Объясните свой ответ. 


Ответ. Процессоры 1.МХ КТ1060 используют адресацию физической памяти с за- 


щитой максимум до 16 областей памяти. Эти процессоры не поддерживают кон- 
цепцию виртуальной памяти со страничной организацией. 


Упражнение 6 


Поддерживают ли процессоры 1.МХ КТ1060 аппаратные вычисления с плавающей 
запятой? Объясните свой ответ. 


Ответ. В разделе 1.3 "Функции" справочного руководства указана следующая 


функциональная возможность: блок вычислений с плавающей запятой одинар- 
ной и двойной точности (ЕРО). 


В "Техническом справочном руководстве по процессору АКМ Сопех-М7", которое 
доступно по адресу ВИр:/Лиосеег.агт.сот/вер/Лор!с/сот.агт.40с.49104895/ 
00104898 _сочех_т7_1гт.р@Ё, говорится, что этот ЕРИ обеспечивает поддержку 
"вычислений с плавающей запятой, согласно требованиям стандарта АМУЛЕЕЕ 
754-2008 — стандарта ГЕЕЕ для двоичной арифметики с плавающей запятой, на- 
зываемого также 1ЕЁЕЕ 754". 


Процессоры 1.МХ ВТ1060 поддерживают аппаратные вычисления с плавающей за- 
пятой. 


Упражнение 7 


Какие функции управления питанием поддерживают процессоры 1.МХ ВТ1060? 


Ответ. В разделе 12.4 справочного руководства описывается подсистема управле- 
ния питанием процессора. Вот некоторые из ее основных особенностей: 


1. Отдельные домены питания для процессора, памяти и остальной части системы. 


2. Встроенные вторичные источники питания, обеспечивающие независимую под- 
держку питания различных подсистем. 


3. Регулирование напряжения и тактовой частоты, обеспечивающее динамическое 
изменение напряжения и частоты (РУЕ5). 


4. Датчики температуры. 
5. Датчики напряжения. 
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Упражнение 8 


Какие функции безопасности поддерживают процессоры 1.МХ ВТ1060? 


Ответ. Компоненты безопасности системы описаны в главе 6 справочного руково- 
дства. Вот некоторые из основных особенностей: 


1. Безопасная загрузка, обеспечивающая проверку цифровой подписи зашифро- 
ванного образа кода. 


2. Встроенное в чип однократно программируемое ПЗУ для хранения информации, 
связанной с безопасностью. 


3. Аппаратный криптографический сопроцессор, поддерживающий алгоритмы 
шифрования АЕ$-128, ЗНА-1 и ЗНА-256. 


4. Генератор истинных случайных чисел для создания безопасных криптографиче- 
ских ключей. 


5. Контроллер ГАС для безопасной отладки с поддержкой пароля. 


6. Интерфейс с памятью, поддерживающий оперативную расшифровку зашифро- 
ванных в ПЗУ данных инструкций. 


Глава 10. Современные архитектуры 
и наборы инструкций процессоров 


Упражнение 1 


Установите бесплатный выпуск У\У15иа1 Заю СоттипйИу, доступный по адресу 
№ рз://у15 ца 5 о. пусгозой.сот/у$/соттипйУ/, на ПК с ОС У/тдо%\. После за- 
вершения установки откройте среду разработки У151а! Зо ШЕ и выберите из 
меню Тоой$ (Инструменты) пункт Се Тоо]5 апд Ееаигез... (Получить инструмен- 
ты и возможности...). Установите рабочую нагрузку ОезК®юр 4деуеортепё мВ С++ 
(Разработка классических приложений на С++). 


В окне поиска \Мтдо\$ на панели задач начните вводить ОБеуе]орег Соттап@ Рготр® 
фог №5 2022. Когда приложение появится в меню поиска, выберите его, чтобы от- 
крыть командную строку. 

Создайте файл с именем 1е11о_х86.азт с содержимым, показанным в листинге ис- 
ходного кода в разд. "Язык ассемблера х8б" главы 10. 


Выполните сборку программы, используя команду, приведенную в разд. "Язык ас- 
семблера хбб" главы 10, и запустите ее. Убедитесь, что на экране отображается 
строка: "Привет, архитектор компьютеров!". 


572 Приложение 


Ответ. Установите \1зпа1 Зи ю Соттипйу как описано в вопросе, затем установи- 
те в У!5иа1 ЗаФю Соттипиу рабочую нагрузку ВезКор деуеортепЕе В С++: 


1. Создайте свой исходный файл на языке ассемблера. Файл Ех__1_пе110_х86.азт со- 
держит следующий пример решения для этого упражнения: 


. 386 
‚тю4е1 ЕЁАТ,С 
.5Фаск 4001 


.соде 
1пс1и4е116 116стё.11Ь 


1пс1иае116 ]ерасу $410 _4е+1п1{1оп$.116 


ехфеги рг1п:пеаг 


ехЕегп ех1+:пеаг 


риуб11с та1п 
та1п ргос 
; Вывод сообщения 
ри$И о+зее теззаве 


са11 рг1"Е 


; Выход из программы с кодом состояния @ 


ри$В 0 
са11 ех1+ 
тма1п епадр 
.Ддафа 


тез5аре ЧБ "Привет, архитектор компьютеров!" ‚0 


епа 


2. Откройте Эеу@орег Соттапта РготрЕ юг УЗ 2022 и перейдите в каталог, со- 
держащий ваш исходный файл. 


3. Создайте исполняемый файл с помощью следующей команды: 


т] /Е1 /71 /74 Ех__1 пе110_х86.азт 
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4. Ниже показаны выходные данные, формируемые программой: 


С:\>Ех__1 Не1]о х86.ехе 


Привет, архитектор компьютеров! 


Это файл листинга, созданный процедурой сборки: 


М1сго$о{* (К) Масго А$зетЬ1ег \ег$1оп 14.31.31104.0 02/21/22 07:39:20 
Ех__1 Пе]1о_х86.а$м Раве 1 - 1 
386 
.тюае1 ЕЁАТ,С 
.5Фаск 4901 
оеооеоее0 ‚ соде 


1пс1и4е116 116стё.116 
1пс1и4е116 1ерасу $41о_де#1п110п$.116 


ехфегп рг1п+:пеаг 
ехфегп ех1*:пеаг 


руб11с та1п 
©оее09ее0 тма1п ргос 
; Вывод сообщения 
ооеоееео 68 00000000 В ри$В о+ф5еф теззаре 
00000005 Е8 00000000 Е са11 рг1пЕ 


; Выход из программы с кодом состояния © 
боеое00А 6А 00 ри$П 0 
00е00е00с Е8 00000000 Е са11 ех1+ 
00000011 та1п епар 


оеовееео0 „Чата 
00000000 48 65 6С 6С 6Е теззаве 46 "Привет, архитектор компьютеров!" ‚0 
2С 20 43 6Е 60 
70 75 74 65 72 
20 41 72 63 68 
69 74 65 63 74 
21 00 


епа 
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Ех__1_Ве11о_х86.азт 


5ертепе$ апд бгоирз: 


Мате 
РЕАТ . еее 
ЪТАСК ..... ее... 
'ЗТАСК' 
ВАТА ооо . . 
ТЕХТ и... .. 


Маме 


Мате 


@Соде$12е ........... 
@ака$12е ...... уе 
@Тпеег+Расе........... 
@Мо4е1........ . 
@соае ............. 
@аата ........... . 
@Рагаака? ......... . 
@Еагаака....... ... 
@$хаск еее . 
ех1е . еее еее 
меззаре ....... ие 
р”... ее... 
@ магп1п8$ 


@ Еггог$ 


М1сгоз$отЕ (В) Масго Аззетб]ег \Уег$1оп 14.31.31104.0 


Ргоседигез$, рагатефег$, апа 1оса1$: 


Приложение 


02/21/22 07:39:20 


$утбо]1$ 2 - 1 

$17е Гепё А11еп СотЬ1пе С1а$$ 

бКОИР 

32 В 00000490 Оуюга Зфаск 

32 ВЦ 00000018 Пуюга Риб11с 'ОАТА' 

32 ВЫ 00000011 Омюга Риб11с 'СООЕ' 
Туре \а1ие АСЕГ 

Р № аг 00000000 _ТЕХТ 1епеек= 00000011 
Туре \а1че АЕЕг 

Митбег  @9е<оеееон 

Митрег  000090000п 

Митбег 000000010 

Митбег 00000007 

Тех _ТЕХТ 

Тех ЕГАТ 

ТехЕ ЕЕАТ 

ТехЕ ЕЕАТ 

Техе ЕЕАТ 

Е №еаг 00000000 ЕТАТ Ехеегпа1 С 

Вубе 00000000 _ОАТА 

Е №еаг 00000000 ЕЕАТ ЕхЕегпа1 С 
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Упражнение 2 


Напишите на ассемблере х86 программу, которая вычисляет следующее выражение 
и выводит результат в виде шестнадцатеричного числа: [(129 -— 66) х (445 + 136}] : 3. 
В этой же программе создайте вызываемую функцию для печати одного байта в 
виде двух шестнадцатеричных цифр. 


Ответ 


1. Создайте свой исходный файл на языке ассемблера. Файл Ех __2_ехрг_х86.азт со- 
держит следующий пример решения для этого упражнения: 


. 386 
‚то4е1 ЕГАТ,С 
.5фаск 4908 


.соде 
1пс1и4де116 116стё.116 
1пс1иде116 1ерасу _$+41о_де+1п1{10оп$.116 


ехеегп рг1п:пеаг 
ехЕегп ех1{:пеаг 


руб11с та1п 

малп ргос 
; Напечатаем начальную строку вывода 
ри$И оОЕЕзеф т$в1 
са11 реп + 


; Вычислим [(129 - 66) * (445 + 136)] / 3 


мо еах, 129 
546 еах, 66 
мо ебх, 445 
ада ебх, 136 
Ми 5х 

пом 6х, 3 
Ч1у 6х 


; Напечатаем старший байт 
ри$Н еах 

моу Ь], ай 

са11 рг1пе_Буе 
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; Напечатаем младший байт 
рор ебх 
са11 рг1пЕ Буе 


; Напечатаем завершающую строку вывода 
ризП ОЕ5еф т$Е2 
са11 реп 


ризП 0 
са11 ех1+ 
та3п епар 


; Передадим байт для печати в ебх 
рг1п®_бу&е ргос 

; Пролог функции х86 

ри$П ебр 

По ебр, езр 


; Используем функцию рг1пЕ+Р библиотеки С 
апа ебх, ОЕ 

ри$В ебх 

ризП ое +тЕ_$*г 

са11 рг1" Е 


; Эпилог функции х86 


ЮУ е5р, ебр 
рор ебр 
гет 


рг1п*_БуЕе епар 


„дата 

{те_$4г 46 "%е2х", 9 

п5Р1 46 "[(129 - 66) * (445 + 136)] /3=", 9 
1582 а6 "в", 9 


епа 


2. Откройте Беуеюрег Соттап@ Рготре Гог У$ 2022 и перейдите в каталог, со- 
держащий ваш исходный файл. 
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3. Создайте исполняемый файл с помощью следующей команды: 


т] ИЕТ /21 /2а Ех__1 Ре11о х86.а5т 


4. Ниже показаны выходные данные, формируемые программой: 


С:\>Ех__2 ехрг_х86.ехе 


[(129 - 66) * (445 + 136)] / 3 = 2ЕАЭН 


Это файл листинга, созданный процедурой сборки: 


М1сгозо{е (К) Масго Аз5етб1ег \ег$1оп 14.31.31104.0 02/21/22 07:42:23 
Ех__2_ехрг_х86.а$т Раре 1 - 1 

.386 

.по4е1 ЕЁАТ,С 

‚5фаск 4004 
00000000 .соде 


1пс1и4е116 116стё.116 
1пс1и4е]16 ]ебасу_$%91о_де1п11оп5.116 


ехтегпт рг1пЕ:пеаг 
ехфегп ех1+:пеаг 


рчб11с та1п 
00000000 тма1п ргос 
; Напечатаем начальную строку вывода 
00000000 68 00000005 К ризИ ое т$в1 
00000005 ЕЗ 00000000 Е са11 реп 


; Вычислим [(129 - 66) * (445 + 136)] / 3 


ооеее08А в8 00000081 Ще) еах, 129 
оое0000Е 83 ЕВ 42 $иБ еах, 66 
00000012 ВВ 000001во МОУ еБх, 445 
00000017 81 С3 00000088 ааа ебх, 136 
00000010 66| Е7 ЕЗ №1 6х 
0000ее2е 66| вв ©0003 [10 6х, 3 


00000024 66| Е7 ЕЗ (А 6х 
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00000027 50 


8А ОС 
Е8 00000017 


5В 
Е8 00000011 


68 00000027 К 
ЕЁ 00000000 Е 


6А 00 
ЕЁ 00000000 Е 


55 
8В ЕС 


81 ЕЗ 000009ЕЕ 
53 

68 00000000 К 

Е8 00000000 Е 


88 Еб 


50 
СЗ 


00000000 25 30 32 58 00 


Приложение 


; Напечатаем старший байт 
ри$П еах 

МОУ 6], ав 

са11 рг1п*_Буе 


; Напечатаем младший байт 


рор ебх 
са11 рг1п®_Буее 


; Напечатаем завершающую строку вывода 
ри$И ое т$Е2 
са11 рг1 п 


ри$П [2] 
са11 ех1е 
ма1п епар 


; Передадим байт для печати в ебх 


рг1пе_Буее ргос 

; Пролог функции х86 
ри$И ебр 

мо ебр, езр 


; Используем функцию рг1пЕЕ библиотеки С 


апа ебх, ОЕ 


ри$П ебх 


ри$В ОЕЕбеЕ Нте_$%г 


са11 рг1п Е 


; Эпилог функции х86 


моу езр, ебр 
рор ебр 
ге 


рг1пе_Буфе епар 


.Ддака 
Чте_$4г 46 "%02х", © 
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00000005 5В 28 31 32 39 — сет 4 "[(129 - 66) * (445 + 136)] /3=", 9 
20 20 20 36 36 
29 20 2А 20 28 
34 34 35 20 28 
20 31 33 36 29 
50 20 2Е 20 33 


20 30 20 ©0@ 
00000027 68 09 152 а6 "|", 9 
епа 
М1сго5оРЕ (В) Масго Аз5етЬ1ег \Мег$1оп 14.31.31104.0 02/21/22 07:42:23 
Ех__2_ехрг_х86.а$т $утЬо15 2 - 1 
5ертепф$ ап бгоирз$: 
Мате $12е Еепё А11еп  СотЬ1те С1а$$ 
РЕАТ „еее. СКОИР 
ЭТАСК „ее еее 32 В 000004090 юг4 — $%аск 'ЗТАСК" 
_БАТА „еее... 32 В 00000029 Оуюг4 — РиБ11с — 'РАТА' 
ТЕХ еее еее. 32 ВЕ  0000005Е Ощюга  РиБ11с — 'СООЕ' 


Ргоседиугез, рагатефег$, ап 1оса]1$: 


Мате Туре \а1ие АЕЕГ 
мат. еее. Р №аг 00000000 _ТЕХТ 1епвеИ= 00000046 Риб11с С 
рг1пе Буве... ........ Р №аг 00000046 _ТЕХТ Тепеп= 00000018 Риб11с С 
$утбо]15: 
Мате Туре \а1ие АСЕг 
04е$512е ........... Митьег ооеоеоеон 
@с 
@0афа$12е ........... Митбег Л 


@ТпеегРасе........... Митбег оееоее01н 


@Еагдака? 


— 90 Еггог$ 


Упражнение 3 


МитБег 
Тех 


Приложение 


000000078 


_ТЕХТ 


ЕБАТ 
ЕБАТ 

БАТ 

ЕЕАТ 

ееоеееее ЕГАТ 
00000000 _ПАТА 
00000005 _ОАТА 
00000027 _РАТА 
еоеее0ее ЕГАТ 


ЕхЕегпа1 С 


Ехегпа]1 С 


В окне поиска \Мтдо\$ на панели задач начните вводить х6б4 Маф1\е Тоо1$ Соттапа 
Рготре ог \5 2022. Когда приложение появится в меню поиска, выберите его, чтобы 


открыть командную строку: 


Создайте файл с именем 1е11о_хб4.азт с содержимым, показанным в листинге ис- 
ходного кода в разд. "Язык ассемблера хб4" главы 10. 


Выполните сборку программы, используя команду, приведенную в разд. "Язык ас- 
семблера хб4" главы 10, и запустите ее. Убедитесь, что на экране отображается 


строка: "Привет, архитектор компьютеров!". 


Ответ 


1. Создайте свой исходный файл на языке ассемблера. Файл Ех __З3 пе110_х64.азт со- 


.соде 
1пс1и4е]116 116сте.11Ь 


ехЕегп рг1пЕ:пеаг 


ехёегп ех{{ :пеаг 


риб11с та1п 
ма1п ргос 


4пс1и4е]16 1ерасу_5%41о_деё1п1{1оп$.11Ь 


держит следующий пример решения для этого упражнения: 


Ответы к упражнениям 581 
; Резервирование места в стеке 
5и6 гзр, 49 


; Вывод сообщения 
]еа гсх, меззаре 
са11 рг1пЕЕ 


; Выход из программы с кодом состояния 9 
хог гсх, гсх 
са11 ех1+ 

та1п епар 


„Дата 
теззаре 46 "Привет, архитектор компьютеров!" ‚0 


епа 


2. Откройте хб4 Майуе Тоо5 Соттапа РготрЕ юг У$ 2019 и перейдите в ката- 
лог, содержащий ваш исходный файл. 


3. Создайте исполняемый файл с помощью этой команды: 


1164 /Е1Т /71 /2а Ех 3 Нео х64.азт 


4. Ниже показаны выходные данные, формируемые программой: 


С:\>Ех__3 пе11]о_х64.ехе 


Привет, архитектор компьютеров! 


Это файл листинга, созданный процедурой сборки: 


М1сгозо+Е (К) Масго Аз$етб1ег (х64) \Мег$1оп 14.31.31104.0 02/21/22 07:47:41 
Ех__3_Ие11о х64.а$т Раре 1 - 1 


во0е0еее0 .соде 
1пс1иае116 116стЕ. 116 
1пс1и4е116 ]ерасу_$%410_де1п1410оп$.116 


ехЕегпт рг1п:пеаг 
ехфегп ех1+:пеаг 


риуб11с та1п 
оееееее0 тма1п ргос 


582 


00000000 48/ 83 ЕС 28 


оеееееед 48/ 80 65 
00000000 К 
оеееоееев Е8 00000000 Е 


00000010 48/ 33 С9 
00000013 Е8З 00000000 Е 
00000018 


2С 20 43 6Е 60 
70 75 74 65 72 
20 41 72 63 68 
69 74 65 63 74 
21 00 


Ех__3_пе11о_х64.азт 


Мате 


меззаве ............ 
р ....... еее. 


@ иагп1пв$ 
@ Еггог$ 


епа 
М1сгозоРЕ (В) Масго АззетЬ1ег (хбА) Мег$1оп 14.31.31164.0 02/21/22 07:47:41 


Приложение 


; Резервирование места в стеке 
$иБ гр, 49 


;} Вывод сообщения 


]Леа гсх, мез5аре 
са11 рг1п Е 


; Выход из программы с кодом состояния [7) 
хог гсх, гсх 

са11 ех1+ 

ма1п епар 


00000000 „даа 
00000000 48 65 6С 6С 6Е меззаре 46 "Привет, архитектор компьютеров!" ‚@ 


$утбо1$ 2 - 1 


Ргоседигез, рагатефег$, ап4 1оса1$: 


Туре \Уа1ие АЕЕг 


Р 00000000 _ТЕХТ 1епруп= 00000018 Риб11с 


Туре \Уа1ие АЕЕГ 


Е 0ее00е0@ _ТЕХТ — Ехкегпа1 
Вуее еееееее@ _РАТА 
ь 00000000 _ТЕХТ — Ехкегпа1 


Ответы к упражнениям 583 


Упражнение 4 


Напишите на ассемблере х64 программу, которая вычисляет следующее выражение 
и выводит результат в виде шестнадцатеричного числа: [(129 — 66) х (445 + 136}] : 3. 
В этой же программе создайте вызываемую функцию для печати одного байта в 
виде двух шестнадцатеричных цифр. 


Ответ 


1. Создайте свой исходный файл на языке ассемблера. Файл Ех__4 ехрг_х64.азт со- 
держит следующий пример решения для этого упражнения: 


.соде 
1пс1иде116 116стё.116 
1пс1иде116 1ерасу_$%41о_де1п110оп$.116 


ехеегп рг1п+:пеаг 
ехёегп ех1{:пеаг 


риб]11с тма1п 

ма1п ргос 
; Резервирование места в стеке 
$И6 гр, 49 


; Напечатаем начальную строку вывода 
Леа ГСХ, М561 


са11 рг1пЕ 


; Вычислим [(129 - 66) * (445 + 136)] / 3 


МОУ еах, 129 
$иБ еах, 66 
МОУ ебх, 445 
ада ебх, 136 
ти] Ьх 

ое 6х, 3 
Ч91у 6х 


; Напечатаем старший байт 
ри$И гах 

ЮУ 61, ай 

апа ебх, ФЕИ 

са11 рг1п*_Буе 


Приложение 


; Напечатаем младший байт 
рор гбх 

апа ерх, о 

са11 рг1п*_Буее 


; Напечатаем завершающую строку вывода 
]еа гсх, м5Е2 


са11 рг1пЕЕ 


; Выход из программы с кодом состояния @ 


хог гсх, гсх 
са11 ех1+ 
ма1п епар 


; Передадим байт для печати в ебх 
рг1пе_Буе ргос 

; Пролог функции хб4 

$46 гр, 49 


; Используем функцию рг1пЕ+ библиотеки С 


Мом гах, гбх 
1еа гсх, НИЕ $5 г 
са11. рг1п ЕЕ 


; Эпилог функции хб4 
ада г5р, 40 


ге 
рг4"е_Буке епар 


„даа 

Ни $6г 4 "Же2х", @ 

т51 — 4 "[(129 - 66) * (445 + 136)] /3 =", 9 
м582 Ф "п", 9 

епа 


2. Откройте х64 Мапуе Тоо!$ Соттап@ РготрЕ ог У$ 2019 и перейдите в ката- 
лог, содержащий ваш исходный файл. 


Ответы к упражнениям 


585 


3. Создайте исполняемый файл с помощью этой команды: 


1164 /Е1 /71 /7а Ех _3 Ие11о хб64.а5т 


4. Ниже показаны выходные данные, формируемые программой: 


С:\>Ех__4 ехрг х64.ехе 


[(129 - 66) * (445 + 136)] / 3 = 2ЕАЭЙ 


Это файл листинга, созданный процедурой сборки: 


М1сгозо+е (В) Масго А$зетЬ1ег (х64) \Мег$1оп 14.31.31104.0 02/21/22 07:49:37 


Ех__4_ехрг_х64.аз$т 


оееоееее 


00000000 48/ 83 ЕС 28 


00000004 48/ 80 @0 
00000005 В 


ть] 


оеее0010 
00000915 
00000018 
00000010 
00000023 
00000026 
0000002А 


ЕЗ8 00000000 Е 


88 00000081 

83 ЕВ 42 

вв 00000180 

81 СЗ 00000088 
66| Е7 ЕЗ 

66| ВВ 0003 
66| Е7 ЕЗ 


Раре 1 - 1 


. сое 
1пс1и4е116 116стё.116 
1пс1и4е116 1ебасу $%910о_ае1п110п$.116 


ехЕегп рг1пЕ:пеаг 


ехЕегп ех1+:пеаг 


риБ11с та1п 

та1п ргос 
; Зарезервируем место в стеке 
$и6 гзр, 49 


; Напечатаем начальную строку вывода 
]еа ГСх, $61 


са11 рг1пЕ 


; Вычислим [(129 - 66) * (445 + 136)] / 3 


МОУ еах, 129 
5) еах, 66 
Ще. ебх, 445 
ада ебх, 136 
ти] 6х 

ЮУ 6х, 3 
Ч1У Бх 


586 


00000020 
0000002Е 
00000039 
00000036 


©0000003в 


©е00005В 


00000058 


©000095Е 
00000062 


50 
8А ОС 


81 Е3 909б0ФЕЕ 
ЕЁ 00000020 


5В 


81 ЕЗ ОебО8ОЕЕ 
ЕЗ 00000014 


48/ 33 С9 


Е8 00000000 Е 


48/ 83 ЕС 28 


48/ 8В 03 
48/ 80 © 


оое0е000 К 


00000069 Е8 00000000 Е 


о000006Е 48/ 83 С4 28 


00000072 
00000073 


СЗ 


; Напечатаем старший байт 


ри$П 
том 
апа 
са11. 


; Напечатаем младший байт 


рор 
апд 


са11 


; Напечатаем завершающую строку вывода 
гсх, м$Е2 


]еа 


са11 


гах 
61, ак 
ебх, о 


рг4п*_Буее 


гЬх 
ебх, ОЕ 


рг1пе Буее 


рг1 п 


Приложение 


; Выход из программы с кодом состояния 9 


хог 
са]11 
тма1п епар 


; Передадим байт для печати в еБх 


гсх, гсх 
ех{ 


рг4пе_Буее ргос 
; Пролог функции хб4 


546 


гзр, 49 


; Используем функцию рг1пЕР библиотеки С 


МОМ 


]1еа 


са11 


гах, гбх 


гсх, ЧИЕ_5 г 


рг1п+ 


$ Эпилог функции хб 


ада 


ге 


г$р, 40 


рг1пе_Буфе епар 
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веее0еее0 ‚Дака 
00000000 25 30 32 58 00 ие _$%г 46 "#92х", 0 
00000005 5В 28 31 32 39 П$61 46 "[(129 - 66) * (445 + 136)] /3 =", 9 
20 20 20 36 36 
29 20 2А 20 28 
34 34 35 20 28 
20 31 33 36 29 
50 20 2Е 20 33 


20 30 20 600 
00000027 68 09 м$2 а "п", 9 
епа 
М1сгозоРЕ (В) Масго Аззеть1ег (хб4) УМег$1оп 14.31.31104.0 02/21/22 07:49:37 
Ех __4 ехрг_х64.азт $утбо1$ 2 - 1 


Ргоседигез, рагатееег$, апа 1оса]15: 


Мате Туре \а1ие АЕЕг 
мал. еее еее. ... Р 00000000 _ТЕХТ 1епвеп= 00000058 РиБ11с 
рг1пе_буе........... Р 00000058 _ТЕХТ 1епё= 00000018 РиБ11с 
$утбо]5: 
Мате Туре \а1ие АСТг 
ех1& еее ее на [В 00000000 _ТЕХТ Ехкегпа]1 
оч ЗО» Вуфе ©0000000@ _РАТА 
т51....... уе. вуе 00000005 _РАТА 
| И ОИ вуе 00000027 _РАТА 
реп. еее еее Е 00000000 _ТЕХТ ЕхЕегпа1 
@ Магп1пЕ$ 


9 Еггог$ 


588 Приложение 


Упражнение 5 


Установите бесплатный пакет Апдго4 З®4дю ТФЕ, доступный по адресу 
В рз$://4еуеорег.ап4го!4.сот/$ и юо/. После завершения установки откройте среду 
разработки Апдго1А Зва4ю ШЕ и выберите из меню Тоо$ (Инструменты) пункт 
ОК Мапарег (Диспетчер ЗОК). Выберите вкладку ЗЮК Тоо$ (Инструменты 
ЗОК) и установите флажок МОК, который может иметь обозначение МОК ($14е Бу 
$14е). Завершите установку МОК (МОК расшифровывается как собственный пакет 
разработки). 


Найдите следующие файлы в каталоге установки ЗОК (местоположение по умол- 
чанию: %ЕОСАГАРРОАТАЯ\Апаго14) и добавьте эти каталоги в переменную среды РАТН: 
агт-11пих-апаго14еаБ1-а$.ехе и а4б.ехе. Подсказка: следующая команда предназначе- 
на для конкретной версии Апдго14 59410 (ваш путь может отличаться): 


ет РАТН=ЖРАТНЯ ; ОСАГАРРОАТАХ\Апаго1а\ 5$ак\пак\23.0.7599858\ 
оо1спа1п5\11ут\ргеби1 1 \м1пд0м5-х86_64\61п ; ХЕОСАЕАРРОАТА\Апаго1а\ 


5Ак\р]1а%Когт-%0015$. 


Создайте файл с именем №е11о_агт.5 с содержимым, показанным в листинге исход- 
ного кода в разд. "32-разрядный язык ассемблера АКМ" главы 10. 


Выполните сборку программы, используя команду, приведенную в разд. "З2- 
разрядный язык ассемблера АКМ" главы 10. 


Включите режим разработчика на телефоне или планшете Апдго14. Указания о 
том, как это сделать, можно найти в Интернете. 


Подсоедините Апдго14-устройство к компьютеру с помощью ОЗВ-кабеля. 


Скопируйте исполняемый файл программы на телефон, используя команды, приве- 
денные в разд. "32-разрядный язык ассемблера АКМ" главы 10, и запустите ее. Убе- 
дитесь, что на экране отображается строка: "Привет, архитектор компьютеров!". 


Ответ 


1. Создайте свой исходный файл на языке ассемблера. Файл Ех __5_пе110_агт.$ со- 
держит следующий пример решения для этого упражнения: 


„Хехе 
.6]оба1 _$%аг* 


$Фагт: 
// Вывод сообщения в файл 1 ($404) с помощью системного вызова 4 
тому г9д, #1 | | 
14г Г1, =т$8 
оу г2, #155 _1еп 
МОУ Г7, #4 


$\С [5] 
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// Выход из программы с помощью системного вызова 1 с возвращением состояния 9 


МОМ ге, #9 

ПЮ\ Гг7, #1 

$\С 0 
„Дафа 
Т5Е: 

‚а$с11 "Привет, архитектор компьютеров!" 
т$в_]еп = . - 58 


2. Создайте исполняемый файл с помощью этих команд: 


агт-11пих-ап@го1Аеаб1-а5 -а1=Ех_ 5 Пе11о_агт.1$% -о Ех__5 Ие]11]о агт.о 
Ех _5 Пе]1о_агт.5 


агт-1]1пих-апаго14еаб 1-14 -о Ех__5 Пе]1]о агт Ех__5 Ие11о агм.о 


3. Следующие строки отображаются после копирования этой программы на уст- 
ройство Апаго19 и ее запуска: 


С:\>а46 аеу1сез 

* Даетоп поф гипп1пр; °Фаг1т8 пом аф фср:5037 
* Даетоп $ФагфеЯ зиссез$Фи11у 

[1${ оф ае\у1сез аЕаспеа 

9826+541374+464а68 аеу1се 


С:\>а@б ризП Ех__5 Пе11о_агт /дафа/1осо]/&тр/Ех__5_Пе]1о_ агт 
Ех _5 Не]11о агт: 1 +1]е ризпеа. 9.9 МВ/з (868 Буфез 1т 0.9595) 
С:\>а@б $°Пе1] сПто +х /дафа/1оса1/&тр/Ех _5_Пе11о_агм 
С:\>ааб °Пе]1] /Чафа/]оса1/%&тр/Ех _5_Пе11о_агт 


Привет, архитектор компьютеров! 


Это файл листинга, созданный процедурой сборки: 


АВМ СА$ Ех__5 Не]110 агт. $ раве 1 
1 „.Вехе 
2 .51оБа1 _$фаг* 
Е] 
4 _$Фаг\: 
5 // Вывод сообщения в файл 1 ($+40и®) с помощью системного 


вызова 4 


590 


6 0000 ©100АФЕЗ 
7 0004 14109ЕЕЗ 
8 0008 1А20АОЕЗ 
9 000с 6470АФЕЗ 
10 0010 ©000000ЕЕ 
11 

12 


Приложение 


том год, #1 

14г Г1, =т$в 
по г2, #т5Е_1еп 
том г7, #4 

$УС [2] 


// Выход из программы с помощью системного вызова 1 с 


возвращением состояния 9 


13 0014 0009АФЕЗ 
14 0018 0179А9ЕЗ 
15 001с 000000ЕЕ 


16 
17 
18 
19 0000 48656С6С 
19 6202043 
19 6607075 
19 74657220 
19 41726368 
20 


Упражнение 6 


МОМ ге, #9 


му Г7, #1 

$мс 0 
‚Дака 
58: 

.а$с11 "Привет, архитектор компьютеров!" 
м5в_1еп =. - м6 


Напишите на 32-разрядном ассемблере АКМ программу, которая вычисляет сле- 
дующее выражение и выводит результат в виде шестнадцатеричного числа: [(129 — 
— 66) х (445 + 136)] : 3. В этой же программе создайте вызываемую функцию для 
печати одного байта в виде двух шестнадцатеричных цифр. 


Ответ 


1. Создайте свой исходный файл на языке ассемблера. Файл Ех__6_ехрг_агт.$ со- 
держит следующий пример решения для этого упражнения: 


‚.Фехе 
.Е1оБа1 _$Фаге 


_$Фагт: 


// Напечатаем начальную строку вывода 
19г Г], =1$61 


тоу г2, #1551 _Леп 


61 рг1пЕ_$%гГ1пв 
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// Вычислим [(129 - 66) * (445 + 136)] / 3 
тоу г@, #129 

$иБ гд, го, #656 

14г Г1, =#445 

ада Г1, г1, #136 

ми? ге, г1, го 

оу г1, #3 

уд]\ ге, г@, г1 


// Напечатаем старший байт результата 


ри$Н {го} 
15г ге, го, #8 
61 рг1п*_Бубе 


// Напечатаем младший байт результата 


рор {ге} 
ы1 рг1п®_Буфе 


// Напечатаем завершающую строку вывода 
14г Г1, =152 

тоу г2, #т$82_1еп 

[о рг1пЕ_$Ег1пв 


// Выход из программы с помощью системного вызова 1 с возвращением состояния 


0 
мо ге, + 
ое г7, #1 
$\С 90 


// Напечатаем строку; г1=адрес строки, г2=длина строки: 
том ге, #1 


Мом Г7, #4 
$мс [2] 
пом рес, 1г 


// Преобразуем младшие 4 бита г@ в символ а$с11 в г@ 
п1561е2а$с11: 

апа год, #9хЕ 

стр ге, #19 


592 Приложение 
ааар1 г@, ге, #('А’ - 10) 
а4ат1 го, го, #'0' 


ту ре, 1г 


// Напечатаем байт в шестнадцатеричном формате 


рг1п*_Буе: 
ри$И {1г} 
ри$И {ге} 
15г ге, ге, #4 
61 п1561е2а$с11 


1аг г1, =Буе$ 
ГЫ г@, [г1], #1 


рор {ге} 

1 п166]е2а$с11 
$4гб ге, [г1] 

19г г1, =Буе$ 


ПО га, #2 
Ь1 рг1п*_$г1 тв 
рор {1г} 
мо\у рс, 1 
„дата 
П$Б1 : 


.а$с11 "[(129 - 66) * (445 + 136)] /3=" 
т5Р1_1еп = . - м$21 


Буфез: 

.а$с11 "??" 
М$Б2: 

.а$с11 "|" 


т$Е2_1]еп = . - $62 


2. Создайте исполняемый файл с помощью этих команд: 


агт-]1пих-апаго1еаб1-а$ -а1=Ех__6_ехрг_агт.1$% -о Ех__6 ехрг_агт.о 
Ех 6 ехрг агт.$ 


агт-11пих-ап@го14еаб1-14 -о Ех 6 ехрг_агт Ех _6 ехрг_агт.о 


Ответы к упражнениям 593 


3. Следующие строки отображаются после копирования этой программы на уст- 
ройство Апдго14 и ее запуска: 


С:\>а@б аеу1се$ 

* даетоп поф гипп1п8; фаг1тв пом аф {ср:5037 
* Чаетоп $Фагфе зиссез5Фи1Лу 

1151 о+ 4е\у1сез$ а аспеад 


9826+541374+464а68 деу1се 


:\>ааб ризй Ех__6 ехрг_агт /дафа/1оса1/4тр/Ех__6_ехрг_агт 
хрг_ агт: 1 +11е ризПеа. 90.2 МВ/5$ (1188 руфе$ 1т 0.0975) 


°Ие]1 сИтоЯ +х /дафа/1оса1/+тр/Ех__6_ехрг_агт 
°Йе1] /дафа/1оса1/тр/Ех__ 6_ехрг_агт 
- 66) * (445 + 136)] / 3 = 2ЕАЭН 


Это файл листинга, созданный процедурой сборки: 


1 .Вехе 

2 .61оба1 _$Жаге 

3 

4 _$Фаге: 

5 // Напечатаем начальную строку вывода 
6 0000 А8109ЕЕЗ 19 Г1, =1$1 

7 0004 2120АОЕЗ МОУ г2, #1$61_]еп 

8 0008 110000ЕВ 61 рг1п_$г1пв 

9 

10 // Вычислим [(129 - 66) * (445 + 136)] / 3 
11 000с 8100АФЕЗ [10.7 г@, #129 

12 0010 420040Е? $и6 ге, го, #66 

13 0014 98109ЕЕЗ 14г Гг1, =#445 

14 0018 881081Е?2 ааа г1, г1, #136 
15 001с 910000Е@ ти] га, г1, ге 
16 0020 0310АФЕЗ [0е. г1, #3 

17 0024 10Е130Е7 ид1у г@, г@, г1 

18 

19 // Напечатаем старший байт результата 


м 
© 


0028 640020Е5 ри$В {ге} 
002с 2004АОЕЛ 15г г@, ге, #8 


1%) 
— 
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22 0030 100000ЕВ 
23 
24 
25 0034 040090Е4 
26 0038 9ЕФО00ЕВ 
27 
28 
29 003с 74109ЕЕБ 
30 ©0040 01209АФЕЗ 
31 0044 020000ЕВ 
32 
33 


Ь1 рг1пе_Буе 


// Напечатаем младший байт результата 


рор {ге} 
61 рг1п* Буее 


// Напечатаем завершающую строку вывода 


14г Г1, 


[ей г2, #т1552_1еп 


61 рг1п 


// Выход из программы с помощью системного вызова 1 


возвращением состояния © 


34 0048 9009АФЕЗ 
35 004с 0179АФЕЗ 
36 0050 000000ЕЕ 
37 


49 0054 0100А@ЕЗ 
41 0058 04709 АФЕЗ 
42 005с 000000ЕЕ 
43 0060 ФЕРОАВЕ1 


47 0064 ОЕООб0Е? 
48 0068 @А0050ЕЗ 
49 006с 37008052 
50 0070 30008042 
51 0074 ОЕРОДФЕ1 


юм го, 
МОУ г7, 
$\С е 


=1$р2 


_$Ег1пЕ 


Приложение 


// Напечатаем строку; г1=адрес строки, г2=длина строки 


рг1пЕ_5г1пв: 


МЮ го, 
Ю\ гу, 
5\С 0 

МОУ рс, 


#1 
#4 


№ 


// Преобразуем младшие 4 бита г@ в символ азс11 в г9 


п1661е2а$с11: 


апа 


// Напечатаем байт в шестнадцатеричном формате 


#9хЕ 
#10 
ге, #('А' 
ге, #'0' 


55 0078 
56 007с 
57 0080 


04Е@20ЕЗ 
049020Е5 
2002АФЕ1 


рг1п_Буее: 
ри$И {1г} 
ри$И {ге} 
15г ге, го, #4 


- 19) 


Ответы к упражнениям 


АВМ СА$ Ех__6 ехрг_агт.$ 


раве 2 
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58 0084 ЕбЕЕЕЕЕВ Ь1 п166]е2а$с11 
59 0088 2С199ЕЕЗ 14г г1, =буве$ 
60 008с 0100С1Е4 г ге, [г1], #1 
61 

62 0090 040090Е4 рор {г9} 

63 0094 Е2ЕЕЕЕЕВ Ь1 п1661е2а$с11 
64 0098 0000С1Е5 $4гЬ ге, [г1] 

65 

66 009с 18109ЕЕБ 19 г1, =Буке$ 
67 00а@ 02209АВЕЗ пом г2, #2 

68 00а4 ЕАРЕРЕЕВ Ы1 рг1п®_$ЕгГ1пв 
69 

70 00а8 04Е09ОЕ4 рор {1г} 

71 0@0ас ФЕРФАФЕ1 Ще. ре, 1 

72 

73 „Дака 

74 МЕ]: 

75 0000 58283132 .азс11 "[(129 - 66) * (445 + 136)] /3=" 
75 39202020 

75 36362920 

75 24202834 

75 34352028 

76 п$81_1еп = . - м$61 

77 

78 Бутез: 

79 0021 ЗЕЗЕ .а$с11 "??" 

80 

81 2: 

82 0023 68 .а5с11 "В" 

83 п552_1еп = . - м$62 


Упражнение 7 


Найдите следующие файлы в каталоге установки Апдго!4 ЗОК (местоположение по 
умолчанию: %ЕОСАЕАРРРАТАЖ\Апаго19) и добавьте эти каталоги в переменную среды 
РАТН: аагси64- 11пих-апаго19-а$.ехе и адЬ.ехе. 


596 Приложение 


Подсказка: следующая команда предназначена для конкретной версии Апаго!4 
Зато (ваш путь может отличаться): 


5еф 
РАТН=ХРАТНХ ; Ж.ОСАГАРРВАТАХ \Апаго1а\5ак\пак\23.0. 7599858 \001сПа1п$\11мут\ргеби11\м 


1п40и5-х86_64\Ь1п ; .ОСАЕАРРОАТАХ\Апаго1а\ак\р1а{Фогт-+001$ 


Создайте файл с именем пе11о_агтб4.з с содержимым, показанным в листинге ис- 
ходного кода в разд. "64-разрядный язык ассемблера АКМ" главы 10. 


Выполните сборку программы, используя команду, приведенную в разд. "б4- 
разрядный язык ассемблера АКМ" главы 10. 


Включите режим разработчика на телефоне или планшете Апдго!4. 
Подсоедините Апдго!4-устройство к компьютеру с помощью ОЗВ-кабеля. 


Скопируйте исполняемый файл программы на телефон, используя команды, приве- 
денные в разд. "б4-разрядный язык ассемблера АЕМ" главы 10, и запустите ее. Убе- 
дитесь, что на экране отображается строка: "Привет, архитектор компьютеров!". 


Ответ 


1. Создайте свой исходный файл на языке ассемблера. Файл Ех __7 пе110_агтб4.$ со- 
держит следующий пример решения для этого упражнения: 


‚Фехе 
.6]оБа1 _5Фаге 


_$фагт: 
// Вывод сообщения в файл 1 ($%д0и®) с помощью системного вызова 64 
Мом х@, #1 


194г х1, = 
тоу х2, #т5р_1еп 
МОМ х8, #64 


// Выход из программы с помощью системного вызова 93 с возвращением состояния 


[2] 
Мом х0, #9 
Мом х8, #93 
$\с 0 
„даа 
мВ: 
.а$с11 "Привет, архитектор компьютеров!" 


м5&_1еп = ..- м8 
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2. Создайте исполняемый файл с помощью этих команд: 


аагси6А-11пих-апаго19-аз -а1=Ех__7_Ие11]о_агтб4.1$+ -о Ех__7_Пе1]0 агтб4.0 
Ех 7 _Пе1]о_ аги64.$ 


аагсй64- 11пих-апаго1а-14 -о Ех 7 Пе110_агмбА Ех__7_Не11о агтбА.о 


3. Следующие строки отображаются после копирования этой программы на уст- 
ройство Апагота и ее запуска: 


С:\>а@б аеу1се$ 

* даетоп поф гипи1п8; збаг&ив пом аф $ср:5037 
* Чаетоп $$агфеЯ зиссе$Фи1]у 

[15${ оф 4е\у1сез$ ааспеа 

9826+541374+464а68 де\у1се 


С:\>а@вб ризп Ех__7_Ие]1о0 агмб4 /дафа/1оса1/+тр/Ех _7_Пе11о_агтб4 
Ех _7 Ие]1]о_агтб4;: 1 +11е ризпед. 9.9 МВ/$ (1152 Буфез$ 1т 9.90295) 


С:\>ааб йе] сптоЯ +х /дафа/1оса1/&тр/Ех _7_Не11о агтб4 
С:\>ааб $Ве11 /аафа/1оса1/%&тр/Ех _7_Пе11о_агтб4 


Привет, архитектор компьютеров! 


Это файл листинга, созданный процедурой сборки: 


ААВСН6Д СА$ Ех__7 Пе]11о_агтб4.$ раве 1 
1 ‚Фехё 
2 .61оба] _5%аге 
Е. 
4 _$Фаге: 
5 // Вывод сообщения в файл 1 ($%40и®) с помощью системного 
вызова 64 
6 0000 20008002 му 0, #1 
7 0004 Е1000058 14г Х1, = 
8 0008 42038002 У х2, #т15р_1еп 
9 000с 08088002 тому х8, #64 
10 0010 01000004 $УС 0 
11 
12 // Выход из программы с помощью системного вызова 93 


с возвращением состояния © 
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13 0014 00008602 тому хе, #0 


14 0018 А8@В8002 [16 х8, #93 
15 001с 01000004 $\с 0 

16 

17 „дата 

18 мЗВ: 

19 0000 48656С6С ‚а$с11 "Привет, архитектор компьютеров!" 
19 6Е2С2043 

19 62607075 

19 74657220 

19 41726368 

20 М$Е_1еп = . - м$в 


Упражнение 8 


Напишите на 64-разрядном ассемблере АКМ программу, которая вычисляет сле- 
дующее выражение и выводит результат в виде шестнадцатеричного числа: [(129 — 
— 66) х (445 + 136)] : 3. В этой же программе создайте вызываемую функцию для 
печати одного байта в виде двух шестнадцатеричных цифр. 


Ответ 


1. Создайте свой исходный файл на языке ассемблера. Файл Ех__8_ехрг_агчибА.$ со- 
держит следующий пример решения для этого упражнения: 


‚Тех 
.61оБа1 _$%аг* 


_$Фаг*: 
// Напечатаем начальную строку вывода 
14г х1, =1$р1 
оу х2, #1$51_1еп 
61 рг1пе_$гГ1пв 


// Вычислим [(129 - 66) * (445 + 136)] / 3 
[и х@, #129 

$и6 х@, хо, #66 

МЮ х1, #445 

ада х1, х1, #136 

ми х@, х1, хо 
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ПОМ х1, #3 
уа1у х@, х@, х1 


// Напечатаем старший байт результата 


МОУ х19, хд 
15г х@, хо, #8 
Ь1 рг1п*_Буе 


// Напечатаем младший байт результата 
ПУ х@, х19 
Ы1 рг1п*_Буе 


// Напечатаем завершающую строку вывода 
14г х1, =1562 

мо\ х2, #т562_1еп 

61 рг1п®_5%г1пв 


// Выход из программы с помощью системного вызова 93 с возвращением состояния 9 


МОм хо, #0 
Ще х8, #93 
$мс [2] 


// Напечатаем строку; х1=адрес строки, х2=длина строки 
рг1п*_$4г1пв: 


пом х@, #1 
МОУ х8, #64 
$\С [2] 

ге х30 


// Преобразуем младшие 4 бита х@ в символ а$с11 в х@ 
п1561е2а$с11: 

апа х@, х@, #9ХЕ 

стр хе, #10 

Ьт1 141е 


ада х@, х@, #('А’ - 10) 
|) опе 


ада хо, хо, #'0' 


600 


опе: 
ге 


х30 


// Напечатаем байт в шестнадцатеричном формате 


рг1пе_бу*е: 


ге 


„Дака 
1581: 
.а$с11 


№581_1еп =. 


Буеес: 
.а$с11 


тв2: 
.а$с11 


М5Е2_1еп =. 


х21, х30 
х20, ход 

х0, хо, #4 
п166]е2а$с11 
х1, =Бубе$ 
м, [х1], #1 


х@, х20 
п1661е2а$с11 
мю, [х1] 


х1, =буе$ 
х2, #2 


рг1пЕ_$г1тв 


х3@, х21 
х30 


"[(129 - 66) * (445 + 136)] /3=" 
- 1581 


пфэн 


"р" 
- $62 


2. Создайте исполняемый файл с помощью этих команд: 


аагсп6А-11пих-апдго1а-а$ -а1=Ех__8 ехрг_агмб4.1$+ -о Ех 
Ех 8 ехрг_агтб4. $ 


Приложение 


_ 8 ехрг_агтб4.о 


аагсй64-11пих-апаго1а-1а -о Ех 8 ехрг_агтбА Ех 8 ехрг_агтб64.о 


Ответы к упражнениям 601 


3. Следующие строки отображаются после копирования этой программы на уст- 
ройство Апаго14 и ее запуска: 


С:\>ааб аеу1се$ 

* Чаетоп поф гипп1пя; зфаг&1тв пом а® {ср:5037 
* Даетоп $$агфеЯ зиссе$Фи11у 

Е15{ оф Чеу1сез а®Фасйпеа 

9826+541374+464а68 дем1се 


С:\>а4аб ризп Ех__8 ехрг_агтбА /дафа/1оса1/+тр/Ех__8_ехрг_агтб4 
Ех__8 ехрг_агиб4: 1 Ее ризвед. 9.1 МВ/5$ (1592 Бу{ез 1т 09.0155) 


С:\>а@б зВе1] сПтод +х /дафа/1оса1/&тр/Ех__8_ехрг_агт64 
С:\>а4@6 °Пе]] /дафа/1оса1/+тр/Ех _ 8 _ехрг_агтб64 
[(129 - 66) * (445 + 136)] / 3 = 2ЕАЭП 


Это файл листинга, созданный процедурой сборки: 


1 .Фехе 

2 .в1оБа1 _$<Фаг* 

3 

4 _$Жаг*: 

5 // Напечатаем начальную строку вывода 
6 0000 С1050058 19г Х1, =т$561 

7 0004 22048002 моу х2, #1$51_1еп 

8 0008 13000094 Ы1 рг1п®_$+г1пв 

9 

1е // Вычислим [(129 - 66) * (445 + 136)] / 3 
11 000с 20108602 мох х@д, #129 

12 0010 00080101 $46 х@, хо, #66 

13 ее14 А1378002 ЮУ — 21, #445 ` 

14 0018 21200291 ада х1, х1, #136 

15 001с 207С909эв п]. х@, х1, хо 

16 0020 61008002 МОУ х1, #3 

17 0024 0008С19А иду х@, ход, х1 

18 

19 // Напечатаем старший байт результата 
20 0028 Е30300АА МОУ х19, хо 


21 002с 90ЕС4803 15г хд, хо, #8 
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22 0030 14900094 
23 
24 
25 0034 Е@0З1ЗАА 
26 0038 12000094 
27 
28 
29 003с 21040058 
30 0040 22008602 
31 0044 04000094 
32 
33 


Приложение 


61 рг1п*_Буе 


// Напечатаем младший байт результата 
мо х@, х19 
Ь рг1пе_Буее 


// Напечатаем завершающую строку вывода 
14г х1, =т562 

ЮУ х2, #1$Е2_1еп 

61 рг1пе_$г1пЕ 


// Выход из программы с помощью системного вызова 93 


возвращением состояния @ 


34 0048 00008002 
35 004с А80В8@02 
36 0050 01000004 
37 

38 

39 

40 0054 20008002 
41 0058 08088002 
42 005с 01000004 
43 00650 С0035Е06 


47 0064 000С4092 
48 0068 1-[2800Е1 
49 006с 649000054 


51 0070 0000991 
52 0074 02000014 
53 
54 
55 0078 0090991 
56 
57 


МОм х@, #0 
оу х8, #93 
$\С 0 


// Напечатаем строку; х1=адрес строки, х2=длина строки 
рг1п_$4г1пв: 


[е. х@, #1 
МОм х8, #64 
$\С [7 

ге х30 


// Преобразуем младшие 4 бита х@ в символ а$с11 в хд 
п1661е2а$с11: 

апа х@, хо, #®ХЕ 

стр хе, #10 

6т1 \41е 


ааа х0, хо, #('А’ - 10) 
Ь аопе 


ада хо, хо, #'0' 


Ответы к упражнениям 


ААКСНбА СА$ Ех __В8 ехрг_агтб4.$ 


58 007с С9035Е06 


59 
60 
61 


62 0080 Е5031ЕАА 
63 0084 ГЕ493009АА 
64 0088 00ЕС4403 


65 


008с 


ЕбЕЕЕЕ97 


66 0090 С1010058 
67 0094 20140038 


68 

69 0098 Е@@314АА 
70 0@9с Е2ЕРЕР97 
71 00а0 20000039 
72 

73 00а4 21010058 
74 ©0а8 42008002 
75 @@ас ЕАРЕЕР97 
76 

77 0069 ЕЕ@З1ЪАА 
78 0064 С0035ЕОб 
79 

80 

81 

82 0000 58283132 
82 39202020 
82 36362920 
82 2А202834 
82 34352028 
83 

84 

85 

86 0021 ЗЕЗЕ 

87 

88 

89 0023 68 

90 


геф 


х39 


// Напечатаем байт в шестнадцатеричном формате 


рг1пЕ_Буе: 


1$81_1]еп =. 


бутез: 
.а$с11 


м582: 
.а$с11 


м$Е2_1еп =. 


х21, х3@ 
х20, хо 

хо, хо, #4 
п166]е2а$с11 
х1, =бубе$ 
ую, [х1], #1 


х@, х20 
п161е2а$с11 
и®, [х1] 

х1, =Буе$ 
х2, #2 


рг1п*_$%гГ1пв 


х3@, х21 
х30 


"[(129 - 66) * (445 + 136)] /3з=" 


- 1551 


ир?" 


"В" 
- $62 


раве 2 


603 
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Глава 11. Архитектура и набор 
инструкций В1$С-У 


Упражнение 1 


Посетите сайт В р$://уу\у\у.$Шуе.сот/боЙууаге/ и скачайте пакет Егеедот УиаГо. 
Это пакет разработки, основанный на интегрированной среде разработки (ОЕ) 
Ес|рзе, который оснащен полным набором инструментов для создания приложения 
В15С-У и его запуска на аппаратном процессоре ВТ$С-У или в среде эмуляции, 
включенной в комплект Егеедот Зо. Установите пакет, следуя указаниям в ру- 
ководстве пользователя Егеедот ито. Запустите Егеедот и создайте новый про- 
ект Егеедот Е ЗОК. В окне создания проекта в качестве цели выберите дети-$уе- 
и54 (это 64-разрядный одноядерный процессор ВТ$С-У в конфигурации КУ64СС). 
Выберите программу-пример пе11о и нажмите кнопку Ейи$В (Готово). Запустится 
сборка программы-примера и эмулятора ВТЗС-У. После завершения сборки ото- 
бражается окно ЕАН СопйригаНоп (Изменение конфигурации). Нажмите Оефи? 
(Отладка), чтобы запустить программу в среде отладки эмулятора. Проведите по- 
шаговое выполнение программы и убедитесь, что в окне консоли отображается 
строка "Не|о, \от4!" ("Здравствуй, мир!"). 


Ответ. Установите пакет Егеедот ЗЧ, как описано выше. Обратите внимание, 
что путь к каталогу для вашей рабочей области не содержит пробелов. Запустите 
Егеедот Зд10: 


1. В окне У@соте № ЭИуе Егеедот о! её Се Загед... (Добро пожало- 
вать в 51 1уе Егеедот 410! Давайте начнем...) выберите 1 \апЕ ® сгезе а пе\у 
Егеедот Е ЗОК Ргодесе (Я хочу создать новый проект Егеедот Е ЗОК). 


2. В окне Сгеме а Егеедот Е ЗОК Ргодесё (Создать новый проект Егеедот Е 
ЗОК) выберите в качестве цели дети-$уе-и54. 


3. Выберите программу-пример №е11о. 

4. Нажмите кнопку Епи$В (Готово). 

5. После завершения сборки отображается окно ЕЗИ СопйригаНоп (Изменение 
конфигурации). 


6. Нажмите Оефиг (Отладка), чтобы запустить программу в среде отладки эмуля- 
тора. 


7. Проведите пошаговое выполнение программы и убедитесь, что в окне консоли 
отображается строка "Нео, У/ой 4!" ("Здравствуй, мир!"). 


Упражнение 2 


Не закрывая проект из упражнения [, в окне Ргодес (Проект) найдите файл 1е110.с 
в папке °гс. Щелкните правой кнопкой мыши на файле и переименуйте его в 
ве110.5. Откройте файл №е11о.5 в редакторе и удалите все содержимое. Вставьте 
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программу на языке ассемблера, приведенную в разд. "Язык ассемблера Е15С-И" 
главы 11. Выполните операцию очистки, затем снова соберите проект (чтобы за- 
пустить операцию очистки, нажмите комбинацию клавиш <СЫ]>+<9>). В меню 
Кип (Выполнение) выберите команду Оефир (Отладка). После запуска отладчика 
откройте окно для отображения исходного файла пе11о.5, окно О1заззет у (Дизас- 
семблирование) и окно Вер1$егз (Регистры). Раскройте дерево Вер%ег$ (Регист- 
ры), чтобы отобразить регистры процессора В1$С-У. Проведите пошаговое выпол- 
нение программы и убедитесь, что в окне консоли отображается строка "Привет, 
архитектор компьютеров!". 


Ответ. Не закрывая проект из упражнения 1, найдите в окне Ргодесе (Проект) файл 
е]10.с в папке гс и сделайте следующее: 


1. Щелкните правой кнопкой мыши на файле и переименуйте его в Не]110.5. 
2. Откройте файл 1е110о.5 в редакторе и удалите все содержимое. 


3. Вставьте программу на языке ассемблера, приведенную в разд. "Язык ассембле- 
ра Е15С-У" главы 11. Это код на языке ассемблера, также доступный в файле 
Ех__2_г1$с\ аззет Лу. $: 


.сесё1от „Жехё 
.61оба1 та1п 


ма1п: 
# Резервирование места в стеке и сохранение адреса возврата 


ада1 $р, хр, -16 
$4 га, 0($р) 


# Печать сообщения с помощью функции риф$ библиотеки С 
1: аи1рс а@, Хрсге1_П1(тзё) 

аа91 а@, а@, Хрсге1_10(15) 

3а1 га, риф 


# Восстановление адреса возврата и зр, возврат к месту вызова 
1а га, 9($р) 
а941 р, $р, 16 


За1г гего, га, @ 


.зесе1оп .годака 
тов: 
.а$с12 "Привет, архитектор компьютеров! \п" 
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4. Выполните очистку, а затем снова соберите проект (чтобы запустить операцию 
очистки, нажмите комбинацию клавиш <С&]>+<9>). 


5. В меню Вип (Выполнение) выберите команду Оефир (Отладка). 


6. После запуска отладчика откройте окно для отображения исходного файла 
Ке110.5, окно О1баззет у (Дизассемблирование) и окно Вер1ег$ (Регистры). 


7. Раскройте дерево Вер ег$ (Регистры), чтобы отобразить регистры процессора 
В1$С-У. 


8. Проведите пошаговое выполнение программы и убедитесь, что в окне консоли 
отображается строка "Привет, архитектор компьютеров!". 


Упражнение 3 


Напишите на ассемблере КТЗС-У программу, которая вычисляет следующее выра- 
жение и выводит результат в виде шестнадцатеричного числа: [(129- 
— 66) х (445 + 136] : 3. В этой же программе создайте вызываемую функцию для пе- 
чати одного байта в виде двух шестнадцатеричных цифр. 


Ответ. Создайте новый проект Егеедот Зло, используя действия, описанные в 
упражнении 1 главы 11. В окне Ргодес (Проект) найдите файл 1е110.с в папке гс: 


1. Щелкните правой кнопкой мыши на файле и переименуйте его в пе110.5. 


2. Создайте свой исходный код на языке ассемблера в файле №е11о.5. Файл 
Ех__3_г15с\_ехрг.5 содержит следующий пример решения для этого упражнения: 


„.зесе1оп „Жехё 
.в1оба] ма1п 


ма1п: 
# Резервирование места в стеке и сохранение адреса возврата 
ааа1 5$р, $р, -16 
$4 га, 0($р) 


# Напечатаем начальную строку вывода 
]а а@, тзв1 
]а1 га, риф 


# Вычислим [(129 - 66) * (445 + 136)] / 3 
ада1 а0, хего, 129 

а941 а@, аб, -66 

аа91 а1, гего, 445 

ада а1, а1, 136 

мы] а0, а1, ао 
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аад1 а1, 2его, 3 
91\и а@, аб, а1 


# Напечатаем старший байт результата 
$ч а@, 8($р) 

$Г1 а@, а@, 8 

3а1 га, рг1пе_Буе 


# Напечатаем младший байт результата 
м а@, 8($р) 
За1 га, рг1пЕ Буе 


# Напечатаем завершающую строку вывода 
Та а0, тзё2 
3а1 га, риф$ 


# Восстановление адреса возврата и $р 
19 га, 9($р) 
аа41 р, р, 16 


# Обнуление кода завершения и возврат к месту вызова 
ада1 а@, гего, 9 
геф 


# Преобразование младших 4 бит в а@ в символ а$с11 в а@ 
п1561е2а$с11: 
# Резервирование места в стеке и сохранение адреса возврата 
ад91 5р, зр, -16 
$4 га, 9(зр) 


апа а@, а@, охЕ 

$144 +0, а@, 109 

Ьпе {0, тего, 1410 
ада а@, аб, ('А’ - 10) 


3 допе 


ада а@, а@, '0' 
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допе: 
19 га, @($р) 
_ а441 р, $р, 16 
ге 


# Напечатаем байт в шестнадцатеричном формате 

рг1пе_Буе: 
# Резервирование места в стеке и сохранение адреса возврата 
аа91 $р, $р, -16 
$4 га, 9($р) 


аа491 {1, а@, © 
$Г1 а@, +1, 4 


]а1 га, п161е2а$с11 
]а +3, Буфе$ 


_ 55 — а6, 0(43) 


аа91 ае, +1, © 
3а1 п1561е2а$с11 


$6 а@, 1(+3) 
]а а@, Буте$ 
3а1 га, ри*$ 
14 га, 0($р) 


ада1 р, $р, 16 
гее 


.зесе1оп „дата 
т$Е1: 
.а$с17 "[ (129 - 66) * (445 + 136)] /3=" 


Буез: 
.азс1х “??" 


м$Е2: 
.а$с12 "В" 


3. 
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Выполните очистку, а затем снова соберите проект (чтобы запустить операцию 
очистки, нажмите комбинацию клавиш <СИ]>+<9>). 


4. В меню Вип (Выполнение) выберите команду ОеБир (Отладка). 


. После запуска отладчика откройте окно для отображения исходного файла 


№е11о.$, окно Озаззет у (Дизассемблирование) и окно Вер1$ег$ (Регистры). 


. Раскройте дерево Вер1$ег$ (Регистры), чтобы отобразить регистры процессора 


В!$С-У. 


Проведите пошаговое выполнение программы и убедитесь, что в окне консоли 
отображается текст: [(129 - 66) * (445 + 136)] / 3 = 2РАЭН. 


Глава 12. Виртуализация процессоров 


Упражнение 1 


Скачайте и установите текущую версию УшмаВох. Скачайте, установите и запус- 
тите Обипы Глпих в качестве виртуальной машины в УпфиаВох. 


Подключите гостевую ОС к Интернету с помощью мостового сетевого адаптера. 
Настройте и включите общий доступ к буферу обмена и файлам между гостевой 
системой Обип и операционной системой хоста. 


Ответ. Выполните следующие действия: 


1. 


Скачайте установщик Упш®а|Вох 6.1 (или более поздней версии) по адресу 
Врз://уууууу.упбиаох.огр/мКИОо\оад$. Выберите версию, подходящую для 
операционной системы на хосте. 


Запустите установщик Ушиа|Вох и подтвердите предложенные по умолчанию 
настройки. 


. Скачайте образ 64-разрядной ОС Чбипы Ипих для Ушиа!Вох. Вот один из ис- 


точников такого образа: ВИрз://му\у\у.о$Бохез.огр/ибипи/. Если образ представ- 
лен в сжатом формате, распакуйте его. Если файл имеет расширение 72, исполь- 
зуйте программу 7-р (В@рз://муу\у.7-7р.ог?/). После распаковки файл 
дискового образа для Ушша[Вох будет иметь расширение уа1. 


. Запустите программу Ушбиа|Вох Мапарег и щелкните на значке Меуу (Создать). 


Дайте новой машине имя, например ЦБипфи, выберите в качестве типа Апих, 
в качестве версии выберите ОБипи (64-5). Щелкните Мех (Далее). 


. В окне Метогу $12е (Объем памяти) подтвердите предложенный по умолчанию 


объем памяти (или увеличьте его, если хотите). 


В окне Нага @15К (Жесткий диск) выберите О$е ап ех1$Яп? уптиа| Вагд 915К @е 
(Использовать существующий файл виртуального жесткого диска). Щелкните на 
кнопке Вго\узе (Обзор) (она выглядит как папка), затем щелкните на кнопке АЗ 
(Добавить) в окне Нага 915К з@есфог (Выбор жесткого диска). Перейдите к ска- 
чанному файлу с расширением \у41 и выберите Ореп (Открыть). Щелкните 
Сгеже (Создать), чтобы завершить создание виртуальной машины. 
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7. Щелкните на значке Зе тр$ (Настройки) в Упта!Вох. В разделе Сепега! (Об- 
щие) на вкладке А4уапсед (Дополнительно) выберите вариант В1гесНопа] 
(Двунаправленный) для параметра ЗВаге4 СИрБоага (Общий буфер обмена). 


8 Щелкните МебмогК (Сеть). На вкладке Адареег 1 (Адаптер 1) рядом с полем 
АНасвеа 0: (Подключение) выберите Ви@ре4 Адар!ег (Мостовой адаптер). 


9. В своей папке боситепе5 (Документы) на диске \Мшдо\з создайте папку с име- 
нем $Наге. Щелкните Эвагед Ко!4ег$ (Общие папки) в окне Зе тр$ (Настройки) 
программы Уйа!Вох Мапарег для своей виртуальной машины Обипа. Щелк- 
ните на значке добавления общей папки (он выглядит как папка со знаком 
"плюс"). Выберите только что созданную на хосте папку зПаге и щелкните ОК. 


10. Щелкните ОК в окне Зе тё$ (Настройки), чтобы закрыть его. 


11. Щелкните на значке Эва (Пуск), чтобы запустить виртуальную машину. Когда 
загрузка системы ОБип завершится, войдите в систему с паролем озбохе$ .огв. 


12. После завершения процедуры входа в систему откройте окно терминала, нажав 
комбинацию клавиш <Си]>+<А>+<Т>. 


13. В окне терминала виртуальной машины установите программные пакеты с по- 
мощью следующих команд. Отвечайте на запросы, чтобы завершить установку: 


$и4о арф-реф ирдафе 
сиЧо арт-веф 1п${а11 всс таке рег1 


и4о ар%-веф 1п5$а11 Би119-еззеп{1а1 11пих-Пеадег$-`ипаме -г’ аКт$ 


14. В меню Ое\усез (Устройства) окна виртуальной мащины ОФипа выберите 
ТГлзег Сие АЗ! ют$ СР Ппаре... (Добавить образ Сие Ад41йопз...). Отве- 
чайте на запросы, чтобы завершить установку. После завершения установки 
перезагрузите виртуальную машину. 


15. Войдите в систему на виртуальной машине и откройте окно терминала. В тер- 
минале виртуальной машины создайте каталог с именем паге, используя сле- 
дующую команду: 


16. Для того чтобы смонтировать общую папку, введите следующую команду в 
терминале виртуальной машины: 


5и4о моипе -& убох$+ -о ги, и19=1900 , 214=1000 зпаге_№о1аег -м/зпаге 


17. Создайте файл в общей папке системы Обипыщ: 


са -/зПаге 


Фочсй +111е1.4х& 
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18. Убедитесь, что на хосте \/до\/$ в папке Боситеп*$\зВаге находится файл с име- 
нем +11е1 . хе. 


Упражнение 2 


В операционной системе Обип, которую вы установили в упражнении 1, устано- 
вите УшпаВох, затем установите и запустите версию виртуальной машины 
ЕгеердО$. Убедитесь в правильности выполнения команд ОО$, таких как еспо Не11о 
№ог1а! и тем, в виртуальной машине Егее)О$. Выполнение этого упражнения озна- 
чает, что вы реализовали экземпляр вложенной виртуализации. 


Ответ 


1. При неработающей виртуальной машине ОБбипи щелкните на значке Зе тр$ 
(Настройки) в УшиаВох Мапарег данной виртуальной машины. В разделе 
Зузет (Система) на вкладке Ргосеззог (Процессор) установите флажок ЕпаЩе 
№ :$е4 УТ-х/АМО-У (Включить вложенную виртуализацию УТ-х/АМО-У). Для 
полной поддержки этой функции требуется УпаВох 6.1 или более поздней 
версии. Нажмите ОК для сохранения изменений. 


2. Запустите виртуальную машину ОБипм. Войдите в виртуальную машину 
Обипш, откройте окно терминала и установите на нее Ушиа!Вох с помощью 
следующей команды: 


5и4о арф-веЕ 1п5%а11 у1гЕиа1Бох 


3. Установите на виртуальную машину Обипи программу 7-/лр с помощью сле- 
дующей команды: 


5и4о ар%-веф 1п$фа1] р771р-+и]11 


4. Скачайте образ виртуального диска Упша]Вох для Егее)О$ по адресу 
В рз://\у\у\.0$Бохе$.огрЛгеедоз/. Выполните следующие действия (при усло- 
вии, что загруженный файл находится в каталоге --/зпар/+1гефох/ соттоюп/Бомп1оа4$ 
и файл образа Егее ОЗ имеет имя 64-61+.72): 


са 

мка1г ‘'\У1тгфна]Вох \ММ5' 

са 'Млгена1Вох \М$' 

шу -/зпар/Р1ге+ох/ соттоп/Обоип]оаЧ$/ бат. 72 . 


72 х БАБ. 77 


5. Запустите Ушша Вох с помощью следующей команды: 


м1геиа]Бох & 
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6. 


Создайте новую виртуальную машину в экземпляре Уп иа Вох, запущенном на 
виртуальной машине Ффип. Выберите следующие параметры: 


Мате: Егееро$ 


Туре: О{пег 


\Мег$10п: 00$ 
32МВ ВАМ 


05е ап ех15{1пй \у1гфиа]1 Пага а1$к +11е 


. Выберите файл УПТ в каталоге -/\1гфиа1Вох Мм$ и завершите настройку вирту- 


альной машины. 


. Щелкните на значке Эаг (Пуск) в УпааВох Мапарег, чтобы запустить вирту- 


альную машину ЕгеерО$. 


. После завершения загрузки виртуальной машины выполните в командной стро- 


ке Егее)О$ следующие команды: 


есйо Не]1о мМог1а! 
мет 


а1г 


На копии экрана на рис. П4 показан вывод результатов выполнения команды пет. 


Егееоо$ [Копп] - Ога{е УМ Уйа{Вох 


Це Масбте \Мем шруё Оеукез Нер 


Рис. П4. Копия экрана ЕгеерО$ 
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10. После завершения работы с Егее)ОЗ закройте виртуальную машину с помо- 
щью следующей команды в командной строке ЕгеерОЗ: 


Упражнение 3 


Создайте две отдельные копии гостевой машины ОБип@ в среде хоста УшааВох. 
Настройте обе гостевые системы ОБипя для подключения к внутренней сети 
УпфшаВох. Задайте в этих двух машинах совместимые [Р-адреса. Убедитесь, что 
каждая машина может получить ответ от другой, используя команду р1пе. Выпол- 
нение этого упражнения означает, что вы настроили в своей виртуализированной 
среде виртуальную сеть. 


Ответ 


1. В системе хоста УитаВох откройте окно Зе т?$ (Настройки) для виртуальной 
машины Оби, настроенной в упражнении [, и выберите настройки МебуогК 
(Сеть). Задайте для параметра типа сети АНасве@ ®: (Подключение) значение 
Пицегпа! (Внутренняя), затем щелкните ОК. 


2. Щелкните правой кнопкой мыши на виртуальной машине Обипя в УшоаВох 
Мапарег и выберите Сопе... (Клонировать...) из контекстного меню. Щелкните 
№ хЕ (Далее) в меню Сюопе УМ (Клонировать виртуальную машину). Оставьте 
Ки! с1опе (Полное клонирование) установленным и щелкните Срюпе (Клониро- 
вать). Дождитесь завершения процесса клонирования. 


3. Откройте командную строку в хост-системе и перейдите в каталог установки 
УпшаВох. В \Уп4до\з для перехода к месту установки по умолчанию можно 
использовать следующую команду: 


сд "\Рговгат Е11е5\Огас1е\\У1гиа1Вох" 


4. Запустите ОНСР-сервер для сети 1ппее Ушша]Вох с помощью следующей ко- 
манды: 


\/ВохМапаре Чйсрзегуег а@ --пефпате 1п{пеф --1р 192.168.10.1 
--пефтаз$К 255.255.255.0 --10щег1р 192.168.10.100 


--ирреглр 192.168.10.199 --епаб1е 


5. Запустите обе виртуальные машины. На основе рекомендованных на предыду- 
щем шаге настроек ОНСР-сервера виртуальным машинам могут быть назначены 
ГР-адреса 192.168.10.100 и 192.168.10.101. 


6. Войдите в систему на обеих запущенных виртуальных машинах и откройте окно 
терминала в каждой из них. 
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Введите в каждом окне терминала следующую команду, чтобы отобразить сис- 
темный [Р-адрес: 


7. Проверьте подключение к другой машине, используя команду р1пё. Например, 
если [Р-адрес текущего машины равен 192.168.10.100, введите следующую ко- 
манду: 


р1ив 192.168.10.191 


Выводимая на экран информация должна выглядеть следующим образом. Для 
того чтобы остановить обновление, нажмите комбинацию клавиш <СН]>+<С>. 


озбохе@о5Бохез :--$ р1пв 192.168.10.101 

РГ\№С 192.168.10.101 (192.168.10.101) 56(84) буфез оф дажа. 

64 Буфез гот 192.168.10.101: 1стр_5е49=1 +41=64 1те=0.372 м5 
64 Буфез +гот 192.168.10.101: 1стр_зе4=2 {{1=64 %1те=0.268 м5 
64 Буфез гот 192.168.10.191: 1стр_зе4=3 {{1=64 Е1те=0.437 тз 
64 Бубзез гот 192.168.10.101: 1стр_е4=4 {1]=64 {1те=0.299 тз 
^С 

--- 192.168.10.1901 р1пвё $$а{1$%1с$ --- 


4 раскеф$ фгапзт1 ед, 4 гесе1уед, 9% раскеф 105$, %1те 3954т5 
ГЕ т1п/аур/тах/тАеу = 90.268/0.344/0.437/0.965 т$ 


о$Бохе@о$Бохез : $ 


8. Выполните команду р1пё на второй машине, указав ГР-адрес первой машины. 
Убедитесь, что реакция системы аналогична предыдущему результату. 


Глава 13. Специализированные 
компьютерные архитектуры 


Упражнение 1 


Нарисуйте блок-схему вычислительной архитектуры для системы круглосуточных 
измерений и передачи данных о погоде с интервалом в 5 минут с помощью тексто- 
вых сообщений 3М$. Система работает от аккумулятора и использует солнечные 
батареи для подзарядки аккумулятора в светлое время суток. Предположим, что 
метеорологические приборы потребляют минимальную среднюю мощность, требуя 
лишь кратковременного выхода на полную мощность в каждом цикле измерений. 
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Ответ. Исходя из требований, процессор, способный переходить в режим низкого 


энергопотребления в течение нескольких минут, должен работать от аккумулятора 
среднего размера в течение нескольких дней подряд. Энергопотребление можно 
свести к минимуму за счет включения метеорологических приборов только на вре- 
мя проведения измерений, а также включения приемопередатчика сотовой связи 
только для передачи данных. 


На рис. П5 представлена одна из возможных конфигураций такой системы. 


Солнечная батарея 


Метеорологические 


Антенна сотовой связи 
приборы 


Система зарядки 


Приемопередатчик 
Сотовой СВЯЗИ 


Аккумулятор Процессор и ОЗУ 


Управление 
энергопотреблением 


Рис. П5. Начальная схема системы сбора данных о погоде 


Упражнение 2 


Для системы из упражнения 1 определите подходящий доступный на рынке про- 
цессор и укажите причины, по которым этот процессор является хорошим выбором 
для решения данной задачи. Факторы, которые следует учитывать, включают стои- 
мость, скорость обработки, устойчивость к суровым условиям, энергопотребление 
и встроенные компоненты, такие как оперативная память и интерфейсы для обмена 
данными. 


Ответ. Выполните следующие действия: 


1. Поиск в Интернете по фразе микропроцессор с малым энергопотреблением дает широ- 
кий выбор процессоров от таких производителей, как ЗТМ, Апаоз? Пеу1сез, 
Техаз шзиатет, Масгосшр Тесвпо]ору и ряда других. 


2. Поиск по фразе встроенный сотовый модем выдает список сотовых модемов, подхо- 
дящих для решения данной задачи. Некоторые из этих устройств выполнены в 
виде модульной системы (зует-оп-тодще, ЗоМ), объединяющей радиочас- 
тотный модем с программируемым процессорным ядром. 


3. Модульная система МшИТесь ОгавопЙу Мапо (В@рз://м\у\ ашЕНесв.сот/ 
Ъгапд$/ти]соппес-гагопПЙу-папо), по-видимому, подходит для решения дан- 
ной задачи. Это устройство продается за 103,95 доллара США и содержит про- 
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цессор АКМ Соцех-М4 для пользовательских приложений. Модуль ОгаропЙу 
Мапо предоставляет следующие интерфейсы ввода-вывода: последовательный 
ЧАБТ, ОЪЗВ, 12С, 5Р1, 9 аналоговых входов и до 29 контактов для дискретных 
входов/выходов. Процессор Соцех-М4 содержит 1 Мбайт флеш-памяти и 128 Кбайт 
оперативной памяти. 


4. В документации ОгаропНу Мапо сказано, что при ежедневной передаче неболь- 
шого объема данных устройство может годами работать от двух батареек типа 
АА. 


5. Причины выбора ОгагопЙу Мапо для решения этой задачи таковы. 


Цена. Несмотря на то что цена более 100 долларов США для микропроцес- 
сорной платы считается высокой, непосредственная интеграция сотового мо- 
дема решает ключевую задачу проектирования системы. 


Низкое энергопотребление. В зависимости от потребностей метеорологиче- 
ских приборов в электропитании небольшая солнечная батарея в сочетании с 
перезаряжаемым аккумулятором небольшой емкости должна легко удовле- 
творить требования системы к питанию. 


Условия окружающей среды. Диапазон рабочих температур для данной мо- 
дульной системы составляет от —40 до +85 °С, что позволяет эксплуатировать 
систему в любой точке мира. Допустимый диапазон относительной влажно- 
сти (от 20 до 90% относительной влажности, без конденсации) требует уста- 
новки в защищенном от воздействия атмосферных факторов корпусе. 


Солнечная батарея 


Метеорологические 
приборы 


Система зарядки Антенна сотовой связи 


Приемопередатчик 


Аккумулято ы 
эт р СОТОВОЙ СВЯЗИ 


Управление 
энергопотреблением 


Рис. Пб. Окончательная схема системы сбора данных о погоде 


Вычислительная мощность. Данная модульная система содержит 32-раз- 
рядный процессор АКМ $ТМ32Е471О0С с тактовой частотой 80 МГц. Он об- 
ладает широкими возможностями, включая блок вычислений с плавающей 
запятой и динамическое масштабирование напряжения. Перед нередачей 
данных можно выполнить обширную предварительную обработку измерений 
(фильтрацию, обнаружение неисправностей датчиков и т. д.). Объем флеш- 
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памяти и оперативной памяти в устройстве вполне достаточен для данной за- 
дачи. 


» Сертифицированное решение. Модуль ОгагопЙу Мапо сертифицирован 
ЕСС и операторами беспроводной связи для использования в сетях сотовой 
СВЯЗИ. 


е Поддержка разработки. Бесплатные инструменты разработки и онлайн- 
ресурсы доступны по адресу № р$://05$.тфед.сот/р!аНогт$/МТ$-Огагопйу- 
Мапо/. 


6. Пунктирная рамка на рис. Пб выделяет часть системы, реализованную с помо- 
щью модуля ОгаропНу Мапо. 


Глава 14. Архитектуры для обеспечения 
кибербезопасности и конфиденциальности 
вычислений 


Упражнение 1 


Для всех своих учетных записей в Интернете, содержащих важные данные, на- 
стройте двухфакторную аутентификацию (где она поддерживается). К таким учет- 
ным записям относятся банковские счета, электронная почта, социальные сети, 
хранилища кода (если вы разработчик программного обеспечения), медицинские 
услуги и все остальное, что для вас ценно. На всех этапах этого процесса необхо- 
димо заручиться гарантией того, что вы используете информацию и программные 
приложения исключительно из надежных источников. 


Ответ. Обширный список веб-сайтов с указанием поддержки (или отсутствия под- 


держки) двухфакторной аутентификации доступен на веб-сайте 2КА Ошес®югу 
(В рз://2{а.@тесфогу/). 2ЕА — это сокращение фразы "двухфакторная аутентифи- 
кация". 


Наиболее распространенным методом реализации двухфакторной аутентификации 
является отправка сайтом 3М$-сообщения с проверочным кодом на номер телефо- 
на, связанный с учетной записью после того, как пользователь введет действитель- 
ное имя пользователя и пароль. 


Код часто представляет собой последовательность из 6 цифр, которую пользова- 
тель должен ввести на веб-сайте для завершения процесса входа в систему. Два 
фактора, используемые для аутентификации, — это знание пользователем пароля 
учетной записи и продемонстрированный доступ к телефону, связанному с учетной 
записью. 


Некоторые веб-сайты поддерживают приложение Вио Мобе (п@р5://дио.сот/ 
ргодис/ти!-Расог-ацПепйсаНоп-т{а/дио-тоБПе-арр) для двухфакторной аутен- 
тификации. При доступе к веб-сайту, использующему это приложение, после ввода 
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имени пользователя и пароля на вашем телефоне отображается уведомление. Для 
подтверждения доступа и завершения входа в систему достаточно одного касания 
экрана. 


Упражнение 2 


Для тех своих учетных записей в Интернете, которые содержат ценную информа- 
цию, но могут быть защищены двухфакторной аутентификацией, создайте надеж- 
ные пароли. Надежный пароль должен быть длинным (15 символов или более) 
и содержать прописные и строчные буквы, цифры и специальные символы (напри- 
мер, ! "#$%&' ()) * +). Для того чтобы отслеживать эти сложные пароли, уста- 
новите и используйте надежное приложение для хранения паролей. Будьте осто- 
рожны при выборе такого приложения и тщательно выбирайте его источник. 


Ответ. Существует множество решений для безопасного хранения паролей на ва- 


шем компьютере и на других устройствах. Большинство браузеров, как и большин- 
ство пакетов антивирусных программ, предлагают решения для управления паро- 
лями. Также доступны отдельные приложения для управления паролями. Вы 
можете сузить свой выбор, выполнив поиск в Интернете по фразе менеджер паролей. 


Когда сайт запрашивает новый пароль, вы можете использовать менеджер паролей, 
чтобы сгенерировать длинную строку произвольно выглядящих символов в качест- 
ве вашего нового пароля. Вам не потребуется запоминать пароль, т. к. он будет на- 
дежно сохранен менеджером паролей. 


При выборе решения для управления паролями следует учитывать необходимость 
сохранения текущих паролей на всех ваших устройствах. Когда вы меняете пароль 
для веб-сайта, вам не захочется делать это в нескольких местах. Менеджер паролей 
на основе браузера, такого как Ейгеох (Вр: //\ууууу 0072Ша.огр/еп-05/), позаботит- 
ся об этом за вас, если у вас есть учетная запись Ееюх и вы выполнили вход в нее 
на каждом своем устройстве. 


Упражнение 3 


Обновите операционную систему, а также другие приложения и сервисы (напри- 
мер, Гауа) на всех компьютерах и других устройствах, находящихся под вашим 
контролем. Это послужит гарантией, что новые функции безопасности, включен- 
ные в эти обновления, начнут работать для вашей защиты вскоре после того, как 
станут доступны. Составьте план для продолжения регулярной установки обновле- 
ний по мере их выпуска, чтобы обеспечить свою защиту в будущем. 


Ответ 


1. Перейдите в настройки обновлений каждого своего устройства и проверьте, 
ожидают ли установки какие-либо обновления. Если такие обновления есть, ус- 
тановите их. 


Ответы к упражнениям 619 


2. Если ожидающих установки обновлений нет, выберите в устройстве функцию 
проверки наличия обновлений и установите все доступные. 


3. Запустите каждое приложение, которое вы используете и на которое полагае- 
тесь, и также выберите функцию проверки наличия обновлений. Установите все 
доступные обновления. 


4. Если в приложении есть функция автоматической проверки наличия обновле- 
ний, убедитесь, что она включена. Возможно, вы хотите получать уведомления о 
доступности обновлений, но не желаете, чтобы они устанавливались автомати- 
чески. 


5. Настройте в своем приложении Календарь повторяющееся напоминание о необ- 
ходимости проверять наличие обновлений для всех устройств и приложений с 
наименьшим интервалом, который вы считаете разумным, будь то еженедельно, 
раз в две недели или ежемесячно. Не выбирайте слишком длинные интервалы, 
т. к. ваши системы уязвимы в период между выявлением уязвимости и установ- 
кой обновления, которое ее исправляет. 


Глава 15. Архитектуры блокчейна 
и майнинга биткоинов 


Упражнение 1 


Откройте веб-страницу для просмотра информации о транзакциях блокчейна по 
адресу ВИр$://6Кар$.сот и найдите список последних блоков. Щелкните на номере 
блока, откроется окно с заголовком блока в шестнадцатеричном формате и хешем 
ЗНА-256. Скопируйте оба эти элемента и напишите программу, чтобы определить, 
является ли предоставленный хеш правильным хешем заголовка. Не забудьте два- 
жды выполнить алгоритм ЭНА-256 для вычисления хеша заголовка. 


Ответ. Файл РуШоп Ех__1_сотрике_Б1оск_НазВ.ру содержит код хеширования заголов- 
ка блока: 


#!Иизг/Бтт/епу руЁпоп 


"""Ех 1 сотри*е_61оск_ВазВ.ру: ответ на упражнение 1 главы 15. 


# Это решение для биткоин-блока 711735. 
# См. ВЕЪр$://Бттар$. сот/711735 


1троге Б1па$с11 
1троге Па$И116 
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# Заголовок блока, скопированный с сайта БТЪар$. сот 

Неадег = '00000020505424е04с22а7+6159843а@48а31957315+' + \ 
'737ес0а0060000000000000000005+7+6с00ас45е441+6са7' + \ 
'713+2604848а771с95е1а+4914043а147а063+64а76781еа4° + \ 
'61139а0с17+666+с1а+46с@8' 


# Хеш заголовка, скопированный с сайта БТФар$. сот 

Леадег Па$И = \ 
'000000000000000000006с01913с2е05а5а38аЗ9а9+@с8Ьа‘ + \ 
к 4269аБе9777+41+' 


# Отсечем все лишние байты, быходящие за пределы 89-байтового заголовка 
Пеадег = КВеадег[ :160] 


# Преобразуем заголовок 6 двоичную форму 
Неадег = 61па$с11 .иппех11Фу(Неаадег) 


# Вычислим хеш заголовка (выполним алгоритм $НА-256 дважды) 
сотрикед_па$Н = Па$В116.5Па256(Веадег).41вез*() 
сотрикед_На$! = Па$0116.$Па256(сотрифей_па$И).41ве${*() 


# Поменяем порядок байтов на обратный 
сотри{е_Па$Н = сотрифей Па$||[::-1] 


# Преобразуем дбоичный хеш заголовка В строку шестнадцатеричных символов 
сотрифед_Па$Н = \ 
61пазс11 .Нех11Фу(сотрифей ПВазп).4есоде("и*+-8") 


# ВыВедем результат 
рг1п*('Хеш заголовка: ' + Пеадег_На$К) 
рг1пе('Вычисленный хеш: ' + сотрифед_Ва$й) 


1+ Веадег_ паз == сотрифед_Пазй: 
ге5и1% = 'Хеши совпадают!‘ 
е1<е: 
гези1* = ' Хеши НЕ СОВПАДАЮТ! ' 


рг1п(гези1 +) 
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Для того чтобы выполнить эту программу, при условии, что Руфоп установлен и 
находится по известному системе пути, выполните следующую команду: 


руспоп Ех__1 сотрифе Боск _Пазй.ру 


Это результат выполнения программы: 


С:\>ру{Иоп Ех__1 сотрифе Б1оск_Назй.ру 

Хеш заголовка: 
009000000000000000006с91913с2е05а5938а39а9+9с8Ба4.269аБе9777+41+ 
Вычисленный хеш: 


900009000000000000006‹с01913с2е95а5938939а94+9с8ба4269абе9777+41+ 


Хеши совпадают! 


Упражнение 2 


Настройте полный равноправный узел ВИисошт и подключите его к сети Висо!. За- 
грузите программное обеспечение Висот Соте по адресу В@р$:/Ьсот.ого/еп/ 
4оууп]0ад. Вам потребуется быстрое подключение к Интернету и не менее 200 Гбайт 
свободного места на диске. 


Ответ 


1. Скачайте установщик ПО Висот Соге, доступный по адресу В р$://Бйсот.ого/ 
еп/до\уоа4. 


2. После завершения установки запустите приложение Висош Соге. Приложение 
запустит скачивание всего блокчейна Висош, начиная с первичного блока, до- 
бавленного в 2009 г., и заканчивая самым последним добавленным блоком. Этот 
процесс может занять несколько часов или дней в зависимости от пропускной 
способности вашего подключения к Интернету. 


3. Для проведения первоначальной проверки приложению Висот Соге потребует- 
ся около 200 Гбайт дискового пространства, однако после этого объем хранимых 
данных можно будет уменьшить до выбранного вами предела, который по 
умолчанию составляет 2 Гбайт. 


4. После скачивания блокчейна узел перейдет к работе в качестве полного равно- 
правного узла сети. Вы сможете отображать подключения приложения к равно- 
правным узлам сети и отслеживать добавление новых транзакций в пул транзак- 
ций, ожидающих включения в следующий блок, который будет добавлен в 
блокчейн. 


5. В этом приложении вы также можете создать биткоин-кошелек и использовать 
его для проведения собственных биткоин-транзакций. Если вы используете это 
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приложение для хранения значительного количества биткоинов, необходимо 
применять наилучшие доступные методы всесторонней защиты операционной 
системы главного компьютера и его приложений, чтобы гарантировать, что они 
не будут взломаны с целью кражи ваших денег. 


Глава 16. Архитектуры 
для самоуправляемых автомобилей 


Упражнение 1 


Если на вашем компьютере еще не установлен Руфоп, перейдите по адресу 
В@рз://у\у\у.руоп.ого/@о\ущоа45/ и установите текущую версию. Убедитесь, что 
файлы Рушоп включены в пути поиска, набрав рупоп --мег$1оп в командной строке 
системы. Вы должны получить ответ, подобный следующему: Рупоп 3.10.3. Уста- 
новите ТепзотЕ]о\/ (платформу для машинного обучения с открытым исходным 
кодом) с помощью команды (также в системной командной строке) рёр 1тзка11 
+епзог-1ои. Возможно, для успешной установки вам потребуется использовать 
функцию запуска от имени администратора при открытии окна командной строки. 
Установите Мафю Ш (библиотеку для визуализации данных) с помощью команды 
рар 1п$а11 тар1о116. 


Ответ. Пакетный файл \//ш40\/$ Ех__1_1п1$%а11 +епзог1ои.Ба+ содержит команды для 
установки ТепзогЕ|о\/ и Маро ШБ: 


ВЕМ Ех 1 11$$а11 КепзогЕом.Ба®: Апзмег Фо СН 16 Ех 1. 


ВЕМ ТИ1$ Бафсй +11е 1п1$$а115$ ТепзогЕ1ом ап Ма®р1о]16 1п И1пдом5. 


КЕМ Ру&{Иоп ми${ Бе 1т5фаеа (зее И{Ъре: //мммм.ру{Поп.ога/аомт]оа4$/). 


ВЕМ Тпе Ру{Поп 1п$фа1Та{1оп а1гесфогу тиз® Бе 1п {Не зузфет рафй. 


руПоп --уег$1оп 


р1р 1п5%а11 $епзогЕ10м 


р1р 1т5фа] тафр1о%116 


Для того чтобы выполнить пакетный файл при условии, что Ру®фоп установлен и 
находится по известному системе пути, откройте окно командной строки от имени 
администратора и выполните команду Ех__1_1п$%а11_+епзог1ом.Ба*. 
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Упражнение 2 


Используя библиотеку ТепзогЕ]о\, создайте программу, которая загружает набор ` 
данных СРАК-10 и отображает подмножество изображений вместе с метками, свя- 
занными с каждым изображением. Этот набор данных является продуктом Канад- 
ского института перспективных исследований (СапаФап ш5ивие Юг Адуапсед 
Везеагсь, СЛЕАК) и содержит 60 000 изображений, каждое из которых состоит из 
32х32 КОВ-пикселов. Эти изображения были случайным образом разделены на 
обучающий набор из 50 000 изображений и тестовый набор из 10 000 изображений. 
Каждое изображение было помечено людьми как представляющее предмет одной 
из 10 категорий: самолет, автомобиль, птица, кошка, олень, собака, лягушка, ло- 
шадь, судно или грузовик. Для получения дополнительной информации о наборе 
данных СТАК-10 см. технический отчет Алекса Крижевски (А!ех Ки2ВеузКу) по 
адресу Вр: //\у\у\у.с$ фогопо.еди/-Кг12Леагитр-Геабиге5-2009-ТВ.рдЕ. 


Ответ. Файл Руоп Ех __2_1оа4_дафазе{.ру содержит код для загрузки набора данных 
и отображения подмножества изображений: 


#!И/изг/Блп/епи руПоп 


Ех__2_1оад_дафазеф.ру: ответ на упражнение 2 главы 16. 


{гот Ееп5ог1ом.Кегаз 1троге дафазее$ 
1трогЕ тафр10т116.рур10 а$ р1* 


4е+ ]оа4_дафазе*(): 
(Ега1п_1тарез$, Фга1п_1аБе1$), \ 
(+е5+ 1тарез, +е${_1аБе1$) = \ 
Датазеф$.с1Фаг10.1оа4 дафа() 


# Приведем значения пикселов к диапазону 0-1 
{га1п_1тарез = {га1п_1тавез / 255.0 
+е$+ 1тарез = +е5® 1тарез / 255.0 


гефигп {га1п_1таре$, +га1п_]абе1$, \ 
{фе$+ 1тарез, тез*_1]аБе1$ 


4е+ р1о*_затр1е$ ({га1п_1таре$, +га1п_1]аБе]$): 
с1а$$ патез$ = ['Азгр]апе', ‘'Аифотоб11е', 'В1га', 
'Сае’, 'Оеег’,'бов', "ЕРгов', 
'Ногзе', '5И1р’, 'Тгиск'] 
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р1%.+12ге(+18$12е=(14,7)) 
ог 1 1т гапве(60): | 
р1%.$и6р10*(5,12,1 + 1) 
р14.х&1сК$([]) 
р1%.уЕ1ск$([]) 
р1*.1т$Ком(+га1п_1таре$[1]) 
р .х1аБе1 (с1а$$_пате$ [{га1п_1аБе1$[1][9]]) 


р1.$Вом() 


1+ _ пате__ == "__ма1п__ 
{га1п_1тарез$, {га1п_1а6е]1$, \ 
{+е5+_1таве$, Фе ]абе15 = ]оад_дафазек() 


р1о{_$атр1е$ («га1п_1таре$, +га1п_]аБе1$) 


Для того чтобы выполнить эту программу при условии, что Руфоп установлен и 
находится по известному системе пути, выполните следующую команду: 


руЕпоп Ех__2 


Если вы получите сообщение об ошибке с текстом сидаг+64_110.411 по +оипа, може- 
те спокойно проигнорировать его. Оно означает, что у вас не установлена библио- 
тека для запуска ТепзогЕ]о\/ на графическом процессоре Му1 Ча СОПА. Вместо него 
данный код будет выполняться (более медленно) на вашем системном процессоре. 


На рис. П7 приведен набор примеров изображений, выводимых кодом. 


%®Рюште 1 


#3 +а= в 


Рис. ПТ. Примеры изображений набора данных СЕАК 


Ответы к упражнениям 625 


Упражнение 3 


Используя библиотеку ТепзогЕ!о\/, создайте программу, которая строит сверточ- 
ную нейросеть (СММ) на основе структуры, показанной на рис. 16.1. Примените 
фильтр свертки 3 х3 в каждом сверточном слое. Используйте 32 фильтра в первом 
сверточном слое и 64 фильтра в двух других сверточных слоях. В скрытом слое ис- 
пользуйте 64 нейрона. Выделите 10 выходных нейронов, отражающих отнесение 
изображения к одной из 10 категорий СТЕАК-10. 

Ответ. На рис. П8 показана структура СММ, аналогичная рис. 16.1. 


&СВ-изображение 

Свертка № 1 и КЕШ 
Группировка с выбором максимума 

Свертка № 2 и КЕЦУ 


Группировка с выбором максимума 


Свертка № Зи КЕЦ) 
Сглаживание 
Плотная АММ 


Плотный вывод 


Идентификация объектов 
Рис. ПВ. Структура СММ для классификации изображений 
Файл РуШоп Ех __3 сгеа*е_пефмогк.ру содержит код для создания этой модели СММ: 


#!/изг/бтп/епуи руЁПоп 


Ех__З_сгеафе пефмогК.ру: ответ на упражнение 3 главы 16. 


{гот епзог+1ом.Кегаз 1троге дафазеф$, 1ауег$, тюде1$, \ 


ор*1т1тег$, 10$5е$ 
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4е+ ]оа4_дафазе*(): 
(+га1п_1тарез, Ега1п_1аБе1$), \ 
(+е$Е_ 1тавез, Фез{ 1аБе]$) = \ 
Дафазет$.с1+аг10.1оа4_дата() 


# Приведем значения пикселов к диапазону 0-1 
{га1п_1тарез$ = га1п_1таре$ / 255.0 


фе$+_1таре$ = %е$*_1тарез / 255.0 


гефигп {га1п_1таве$, +га1п_]абе1$, \ 
те 1тарез$, %е5+_1]абе]1$ 


де+ сгеае_тюае1(): 
# Каждое изображение имеет размер 32х32 пиксела и 3 цветовые плоскости ЕСВ 


1таре_Паре = (32, 32, 3) 


# Размер ядра сверточного фильтра составляет 3х3 пиксела 


сопм_Е114ег_$12е = (3, 3) 


# Количество сверточных фильтров В каждом слое 


+11{ег$_]ауег1 = 32 
+1] %ег$_]ауег2 = 64 
+11]{ег$ _]ауег3 = 64 


# Выполним группировку с выбором максимума В области 2х2 пиксела 
роо11пв_$12е = (2, 2) 


# Количество нейронов В каждом плотном слое 
р194деп_пеугоп$ = 64 


оифри®_пеигоп$ = 10 


поде1 = тоде1$ .5едиепе1а1 ([ 
# Первый сверточный слой, за которым следует группировка с Выбором максимума 
]ауег$ .Сопу20(+114ег$_1]ауег1, сопу_+11%ег_$12е, \ 
асЕ1уа1оп='ге1и', 1приЕ_$Наре=1таре_$Паре), 


]ауег$ .МахРоо11п=20(роо11п8_$127е), 
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# Второй сверточный слой, за которым следует группировка с выбором максимума 
1ауег$ .Сопу20(+11%ег$_]ауег2, сопу +11Лег $12е, \ 
ас*1\уа1оп='ге]и'), 


1ауег$ .МахРоо11пЕ20(роо11п8р_$12е), 


# Третий сверточный слой, за которым следует сглаживание 
1ауег$ .Сопу20(+11%ег$_]ауег3З, сопу_+11%ег_$12е, \ 
асЕ1уа*1оп='ге1и'), 


]Лауег$.Е]а{+еп(), 


# Плотный слой, за которым следует Выходной слой 
]ауег$ .Вепзе(в1Адеп_пеигоп$, ас&1уа1оп='ге1и'), 


1ауег$ .Бепзе(оцри*_пеигоп$) 


]) 


то4е] .сотр11е(ор*1т1тег=ор{1т1тег$.Адат(), \ 
105$$=10$5е$ .брагзеСаферог1са1Сго$епгору( \ 


гот_10214$5=Тгие), тефг1с$=['ассигасу' ]) 


гефигп тоде1 
1+ _ пате__ == '_ мат‘: 
{га1п_1тарез$, {га1п_1аБе]5, +е5*_1тарез, \ 
+е$+_1аБе15 = 1оаЯ_4афазе*() 
поде] = сгеафе_пюде]1() 


поде] . зиттагу () 


Для того чтобы выполнить эту программу при условии, что Руоп установлен и 
находится по известному системе пути, выполните следующую команду: 


ру{поп Ех__3 сгеафе пемогк.ру 


ПРИМЕЧАНИЕ 


сутствии графического процессора, если в вашей системе его нет. Если 
графический процессор не настроен для использования с ТепзогЕ]о\,, 
этот код будет выполняться на системном процессоре. 


и Вы можете игнорировать любые предупреждающие сообщения об от- 
\ 5 
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Вот результат выполнения программы: 


С:\>Ех__3 сгеафе пе®могКк.ру 


2021-12-12 19:26:07.938984: Т ХепзогЕ1юм/соге/р1а{Фоги/ сри_+еафиге_вчага. 
сс:151] ТИ1$ ТепзогЕ1ом б1пагу 15 ор®1т1тей "1ЕН опедАРТ Беер Меига1 
Мефмогк 11Б6гагу (опебММ) Фо изе {Не Фо1Том1птв СРИУ 1п5гисЕ1оп$ 1п 
регфогтапсе-сг1{1са1 орега&1оп$: АМХ АМХ2 


То епаб]е Фпет 1п офНег орега{1оп$, геби11]а ТепзогЕ1ом и1ЕИ {Пе 
арргорглафе сотр11ег +1а5$. 


2021-12-12 19:26:08.282366: Т 
Тепзог1о\/ соге/ сотиюп_гип1те/ври/эри деу1се.сс:1525] Сгеа{ед аеу1се 
/306: 1оса]Ио$%/гер11са:9/Фазк:9/ 


де\у1се:СРУ:@ улеН 3617 МВ метогу: -> деу1се: @, пате: Оцадго Р22909, рс1 Биз 19: 
0000:91:00.0, сотрифе сараб111%у: 6.1 


Моде]: "зедиеп{1а1" 


Ёауег (фуре) ОифриЕ 5Паре Рагат # 


сопу2а (Сопу20) (Мопе, 30, 36, 32) 


тах_роо]11п2249 (МахРоо11п220 (Мопе, 15, 15, 32) 
) 


сопу24_1 (Сопу20) (М№пте, 13, 13, 64) 


тах_роо111824_1 (МахРоо11пв (№пе, 6, 6, 64) 
20) 


сопу24_2 (Соп\20) (№пе, 4, 4, 64) 


Наффеп (Е]а{феп) (№пе, 19024) 


Чепзе (Бепзе) (№опе, 64) 


Чепзе_1 (Шеп$е) (Мопе, 10) 
Тофа] рагат$: 122,570 


Тга1паб]е рагамз: 122,570 
№п-{га1паб1е рагам$: © 


С: \> 
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Упражнение 4 


Используя библиотеку ТепзогЕ ю\/, создайте программу, которая обучает нейросеть 
СММ, разработанную в упражнении 3, и испытайте итоговую модель с помощью 
тестовых изображений набора СРАК-10. Определите долю правильно идентифи- 
цированных нейросетью тестовых изображений. 


Ответ. Файл РуШоп Ех __4 {га1п_поде1.ру содержит код для создания, обучения и 
тестирования модели СММ: 


#!/изг/Бтп/епу руЁпоп 


Ех__4 фга1п_тюде].ру: ответ на упражнение 4 главы 16. 


{гот епзог+1ои.Кега$ 1трогЕ Чафазе*$, 1ауег$, тоде1$, ор®1т12ег$, 105$е$ 


1трог{ тафр1о0*116.рур10о® а$ р14 


е+ 1]оа4_дафазе*(): 
(Ега1п_1таре$, {га1п_1аБе15), \ 
(+е5+_ 1тарез, +ез{ 1абе1$) = \ 
Датазет$.с1+аг10.]оаЧ_дафа() 


# Приведем значения пикселов к диапазону 9-1 
{га1п_1тарез$ = {га1п_1таре$ / 255.0 


{е5{ 1тарез = $е5* 1тарез$ / 255.0 


гефигп {га1п_1таве$, «га1п_1абе]1$, \ 


е5+_1тарез, +е5*_]аБе]1$ 


4е+ сгеафе поде1(): 
# Каждое изображение имеет размер 32х32 пиксела и 3 цветовые плоскости ВСВ 
1таре_$Паре = (32, 32, 3) 


# Размер ядра сверточного фильтра составляет 3х3 пиксела 


сопу_+11{ег_$127е = (3, 3) 


# Количество сверточных фильтров 6 каждом слое 
+1]%ег$_1]ауег1 = 32 
64 
64 


+1]+ег5_]ауег2 


+11]{ег5_]ауег3 
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# Выполним группировку с выбором максимума В области 2х2 пиксела 
роо11п8_512е = (2, 2) 


# Количество нейронов 6 каждом плотном слое 
119деп_пеигоп$ = 64 


оифри{_пеигоп$ = 19 


тоде1 = поде]$ .5едиеп1а1 ( [ 
# Первый сверточный слой, за которым следует группировка с Выбором максимума 
]ауег$ .Сопу20(+11]4ег$_1ауег1, сопи_#114ег_$12е, \ 
асе1уа1оп='ге]и', 1при®_$Наре=1таре_зПаре), 


]Лауег$ .МахРоо11пЕ20(роо11пв_$12е), 


# Второй сверточный слой, за которым следует группировка с быбором максимума 
1ауег$ .Сопу20(+11%ег$_]ауег2, сопу #114ег_$12е, \ 
ас{1уа*1оп='ге]и'), 


]Лауег$ .МахРоо11п220(роо11п8_$127е), 


# Третий сверточный слой, за которым следует сглаживание 
]Лауег$ .Сопу20(+114ег$_]ауег3З, сопу_+114ег_$12е, \ 
асЕ1уа1юоп= 'ге]1и'), 


1ауег$ .Е1а*еп(), 


# Плотный слой, за которым следует Выходной слой 
]ауег$ .Бепзе(Н14деп_пеугоп$, ас&1уа1оп='ге!и'), 


]Лауег$ .Оепзе(ои{ри*_пеигоп$) 


1) 


тоде] .сотр11е(оре1т1тег=ор*1т1тег$.Адат(), 
10$$=10$5е$ .брагзеСаферог1са1Сго$епгору( \ 


+гот_1081*$=Тгие), тефг1с$=|['ассигасу' ]) 
гефигп тоде]1 


де+ +га1п_пюде1 (+га1п_1тавез$, «га1п_]абе1$, \ 
+е5+_1тарез, Фе$*_1аБе]$, пюае1): 
115$фогу = тоде] .+1+ (+га4п_1тарез, {га1п_1абе]1$, 
еросН$=1@, уа11ЧаЕ1оп_дафа=(+е$*_1тавез, +ез_1абе1$)) 
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те5*_10$$, фе5®_асс = пю4е]1.еуа]иае(+е$+_1таре$, \ 
те5*_1]абе]$, уегБозе=2) 


гефигп 115%огу, $е$*_ асс 


деф р1о*_тоде]1_ассигасу(11$%огу): 
р1*.1виге() 
р1*.р10*(В15$%огу.Н15$%огу[ 'ассигасу'], 1аБе1='Точность' ) 
р1*.р1о*(В15фогу.[1$огу['\а]_ассигасу' ], 

1абе] = Точность проверки’) 

р1*.х1аБе]1 ( 'Эпоха') 
р1*.у1аБе]1 ( 'Точность') 
р1*.у11т([9.5, 1]) 
р1*.1евепа(1ос='иррег 1е+') 
р1*.вг1а() 
р14.5$Пом() 


1+ _ пате__ == '_ тат": 
{га1п_1таве$, %га1п_]абе1$, +е5*_1тавез, \ 
те$+_1]аБе1$ = 1оа4_дафазе*() 
поде1 = сгеафе_ тюде1() 
В15$огу, %е5_асс = $га1п поде1(+га1п_1тавез, \ 
{га1п_]абе]$, $е${ 1тарез$, +ез*+ ]абе]$, тоде1) 
рг1п*() 
рг1пЕ( '='*31) 
рг1п*('| Точность проверки: {:.24}% |’. 
Фогта* (100*%е$+_асс)) 
рг1пЕ('='*31) 
р1о*_пю4е1_ассигасу(11$%огу) 


Для того чтобы выполнить эту программу при условии, что Руоп установлен и 
находится по известному системе пути, выполните следующую команду: 


рупоп Ех 4 фга1п_тоде1.ру 


ПРИМЕЧАНИЕ 


сутствии графического процессора, если в вашей системе его нет. Если 
графический процессор не настроен для использования с ТепзогЕ|о\, 
этот код будет выполняться на системном процессоре. 


и Вы можете игнорировать любые предупреждающие сообщения об от- 
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Ваши результаты должны указывать на точность примерно 70%. Для такой простой 
СММ это огромное улучшение по сравнению с точностью случайного угадывания, 
которая составила бы 10%. 


Вот результат запуска программы: 


2021-12-12 17:55:19.492677: Т ТепзогЕ1ом/соге/р1а{Фогт/сри_Феафиге; виага.сс:151] 
111$ ТепзогЕ1ом Б1пагу 15 ор{1и1хед м1{И опеАРТ Веер М№ецга1 Мефмогк Ё16гагу 
(опебММ) Фо изе Ве Ро]Том1пв СРУ 1п$гис1опт$ 1п регРогтапсе-сг11са1 орега*1опз: 
А\/Х А\Х2 

То епаб]Ле {Пет 1п офпег орега1оп$, геби11а ТепзогЕ]ом м1И Пе арргорг1ате 
сотр11ег Е1ав$. 

2021-12-12 1.0 о. | 

сеп5ог+1ом/соге/ соттоп_гип1те/эри/ври 4еу1се.сс:1525] Сгеафед деу1се 

/ 06: 1оса]по$&/гер11са:9/фазк:0/деу1се:бРИ:0 или 3617 МВ тетогу: -> аем1се: @, 
пате: Оцадго Р2200, рс1 Би$ 14а: 0000:01:00.0, сотрифе сараб111т%у: 6.1 

Еросй 1/19 


2021-12-12 17:55:21.475358: Т ТепзогЕ1о0м/ {геат ехесифог/сида/сида_апп.сс:366] 
[оадед сибММ мег$1оп 8301 


1563/1563 [============== Е=ЕЕЕ====] - 9$ 515/5{ер - 105$: 1.5032 


ассигасу: 9.4521 - уа1 1055: 1.2326 - \уа1 ассигасу: 9.5559 


Еросй 2/19 


1563/ 1563 [======ЕЕ====== == ] 
ассигасу: 9.5996 - \а1 1055: 1.0361 - уа] ассигасу: 9.6318 


Еросй 3/10 
1563/1563 [Е===== т рр ===] -- 35 5] < 7 тер - 
ассигасу: 0.6589 - \а1 1055: 1.0053 - уа1 ассигасу: 9.6517 
Еросй 4/19 


1563/1563 [=============ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ=] - 75 51$/5фер - 
ассигасу: 9.6904 а] 1055: 9.8999 - уа] ассигасу: 0.6883 


Еросй 5/10 


1563/1563 [======ежнен=ннннаневаананкек===| - 7$ 5и$/$ер - 1055; 
ассигасу: 9.7177 - уа1. т. 0.8924 - уа] ассигасу: 0.6956 


Еросй 6/19 
1 563 / и 563 [ ооо рота ооо фей реф | - 7 5 51$ / $ е ер - 
ассигасу: 9.7374 - \уа1 105$: 0.9180 - уа] ассигасу: 0.6903 
т 7/10 


> реа | - 75 511$ / ъ<тер - 10$9' 
ассигасу: 9.7548 у 105$: 0.8755 - \уа1 ассигасу: 0.7074 
Еросй 8/19 
=] - 75 бМз/сбер - 
ассигасу: 9.7694 - уа1 105$: 0.8505 - уа] ассигасу: 9.7116 
Еросй 9/19 


156 3/1 563 [=== нс едеы ====== | - 85 51$5/$тер 
ассигасу: 9.7842 - уа1 105$: 0.88509 - уа1 ассигасу: 0.7058 
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Еросп 19/19 


1563/1563 [ ] - 8$ 5т5/зфер - 10$$: 0.5825 - 
ассигасу: 09.7943 - \уа1 1055: 9.87409 - \уа] ассигасу: 9.7128 


313/313 - 15$ - 19$$: 9.8740 - ассигасу: 9.7128 - 648т5/еросй - 2т5/зфер 


На рис. ПЭ отражена точность классификации СММ на обучающих изображениях 
(Точность) и тестовых изображениях (Точность проверки) после каждой из 10 эпох 
обучения. 


‹» Роуге 1 


1.0 
== Точность 
Точность проверки 


0.9 


0.8 


Точность 


0.7 
0.6 


0.5 


#3 += 


Рис. ПЭ. Точность классификации изображений сетью СММ 


Глава 17. Квантовые вычисления 
и другие перспективные направления 
в вычислительных архитектурах 


Упражнение 1 


Установите платформу разработки программного обеспечения для квантовых про- 
цессоров О15КИ, следуя указаниям по адресу: № рз:// 915 КИ.ого/доситетайоп/ 
ге т?_$а ед .Иет]. Эти указания предполагают установку набора инструментов 
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для обработки данных И машинного обучения Апасопда 
(№ рз://у\у\у.апасопда.сот/). После установки пакета Апасопда создайте вирту- 
альную среду Сопда с именем д1$Кекепу, где будет проходить ваша работа над кван- 
товым кодом, и установите О1$Ке{ в этой среде с помощью команды рёр 1п5*а11 
41зк1+. Убедитесь, что вы установили дополнительные зависимости визуализации с 
помощью команды р1р 1п$%а11 91$К1{-«егга[у1$иа11та*1оп]. 


Ответ 


1. Загрузите установщик Апасопда по адресу ВИрз://муууу.апасопда.сот/ 
915ибоп/. Выберите текущую версию и соответствующий 32- или 64-раз- 
рядный вариант для вашего главного компьютера. 


2. Запустите установщик Апасопда и подтвердите предложенные по умолчанию 
настройки. После завершения установки закройте программу установки. 


3. Запустите Апасопда из строки поиска \Утдо\$, набрав апасопда и щелкнув на 
Апасопда Рготрь, когда эта фраза обнаружится в списке поиска. Отобразится 
окно консоли. 


4. С помощью приглашения Апасопда создайте и активируйте виртуальную среду 
с именем 4915К\{епу посредством следующих команд (установите все рекомен- 
дуемые пакеты): 


сопда сгеафе -п 91$К1ЛФепу ру{Поп=3.8 


сопда ас&1уафе 91$К1{епу 


5. Установите ©15КИ и зависимости визуализации с помощью следующих команд: 


р1р 1п5$фа11 491$К1{ 


р1р 1п5фа11 4915К1-кегга[\1$нца 1хае1оп] 


6. На этом установка завершена. 


Упражнение 2 


Создайте бесплатную учетную запись 1ВМ Опапат по адресу: Вр5$://диатит- 
сотрийпр?.т.сот/. Найдите свой токен для [ВМ Очатшит Зегу1сез АР] на веб- 
сайте В@рз://диашит-сотрийпр.Фт.сот/ассоипЕ и установите его в свою ло- 
кальную среду, используя указания по адресу № Ирз://448КИ.огр/аоситетавоп/ 
$аЫе/0.24/Л па .В ет. 


Ответ 


1. Посетите веб-сайт ВИрз://дцатит-сотрийп?.Ют.сот/. Если у вас еще нет 
учетной записи, щелкните по ссылке Сгезе ап ВМ] ассошии (Создать учетную 
запись [ВМП19), чтобы ее создать. 
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2. После входа в систему найдите на экране поле АРТ ®юКеп. Нажмите кнопку, что- 
бы скопировать свой АР]-токен в буфер обмена. 


3. Вернитесь к командной строке Апасопда для работы со средой д1$К14епм, кото- 
рую вы создали в упражнении [. 


4. Введите в командной строке Апасопда следующие команды, чтобы настроить 
свой АР|-токен (вам нужно будет заменить Му_ТОКЕМ на тот, который вы скопиро- 
вали в буфер обмена на шаге 2): 


ру{Поп 


Ттроге 91$К1 


гот 91$К1е 1троге ТВМО 
ТВМО . сауе_ассоип* ( 'МУ_ТОКЕМ') 


Упражнение 3 


Рассмотрите пример квантовой программы на веб-сайте И рз:// 91$ Ю.ого/ 
доситетабоп/ итог! а15/с1гси1 5/1 _ сете _ $ агед_ ув _а5К.ВЬш. В этом приме- 
ре создается квантовая схема, содержащая три кубита, которая реализует состояние 
Гринбергера — Хорна — Цайлингера (ГХЦ — Огеепбегрег — Нотше — Хе!прег, 
СНА). Состояние ГХЦ проявляет ключевые свойства квантовой запутанности. Вы- 
полните код в среде моделирования на своем компьютере. 


Ответ 


|1. Запустите консоль командной строки Апасопда. Введите апасопда в поле поиска 
\УМт4до\5 и щелкните на Апасопда рготрё когда эта фраза появится в списке 
поиска. Отобразится окно консоли. 


2. Войдите в среду 41$К1*епу с помощью следующей команды: 


сопда ас®1\уафе 91$К1Фепу 


3. Введите в командной строке Апасопда следующие команды: 


ру{поп 
ппрогЕ питру аз пр 


гот 915$К1Е 1лтроге * 


4. Создайте квантовую схему с тремя кубитами в состоянии ГХЦ и добавьте изме- 
рения для каждого кубита: 


слгс = Оцап®имСаеситЕ (3) 


# Добавим затвор Н для кубита @ для создания суперпозиции 


слгс.П (9) 


Приложение 


(СМОТ). Кубит @ - управляющий, кубит 1 - цель 


затвор СХ (СМОТ). Кубит @ - управляющий, кубит 2 - цель 


им измерение для каждого из кубитов 


ОцапфимС1гси1 (3, 3) 


: оо й р. Е 
пеа$.багглег(гапее(3)) 


| гер15Тег(теа$.сгев$[9]) 


с. сотро$е (теа$ ) 


6. Запустите схему на своем компьютере, используя имитатор дазт_51ти1афог. Па- 
раметр зПо*5 обеспечивает подсчет количества проходов выполнения схемы для 
сбора статистических результатов: 


`.реф БасКепа( 'дазт_$1ти1атфог') 


14_$1т. гип({гап$р11е(ас, Баскепа $1т), $Пот$=1924) 
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7. Извлеките и отобразите количество появлений каждого битового шаблона в ре- 
зультате проведения моделирования: 


гези]1* $1м = 06 51т.гези 1 () 


сои 5_51т = гези К $1т.реф соий{5 (ас) 


СОиП $51 


8. Должны быть выведены результаты, похожие (но не идентичные) на следую- 
щие: 


>>> СОиПЕ$_$51т 


{'111': 506, '000’': 518} 


>>> 


Упражнение 4 


Выполните код из упражнения 3 на квантовом компьютере 1ВМ. 


Ответ 
1. Повторите шаги 1-5 из упражнения 3, чтобы создать квантовую схему. 


2. Импортируйте информацию о своей учетной записи [ВМО и выведите список 
доступных поставщиков ресурсов для квантовых вычислений: 


гот 91$К1% 1трог® ТВМО 
ТВМО.]оа4_ассоип* () 


ргом1аег = ТВМО.веф_ргоу14дег(вгоир=‘ореп') 


ргоу1Аег.БасКеп4а$ () 


3. Если вы посетите веб-страницу ВМ О\чатат по адресу ВИр$://дцаптеит- 
сотрийпр.Ют.сот/, вы сможете увидеть длину очередей заданий для доступ- 
ных квантовых компьютеров. Выберите систему с достаточным для вашей схе- 
мы количеством кубитов и короткой очередью заданий. В этом примере предпо- 
лагается, что вы выбрали компьютер 16та_борожа. 


4. Добавьте свое задание в очередь и следите.за его состоянием с помощью сле- 
дующих команд. Параметр °Но*5 обеспечивает подсчет количества проходов вы- 
полнения схемы для сбора статистических результатов. 


Баскепа = ргоу1аег. реф _Баскепа( '16та Борожа’) 


гот 91$К1*.$001$.топ1ог 1троге об топ ог 


06 ехр = ехеси*е(ас, Баскепа=Баскепа, $Во*5=1924) 


06 моп1$ог(7о6_ехр) 


638 Приложение 
После завершения прогона вы увидите следующую строку вывода: 


Зоб $Фафи$: ]06 Паз зиссе$$РиМу гип 


5. После завершения задания извлеките результаты с помощью следующей коман- 


ды: 
гези]{ ехр = 306 ехр.гези1*() 


6. Извлеките и отобразите количество появлений каждого битового шаблона в ре- 
зультате прогона квантового компьютера: 


соип*$_ехр = гези1% ехр.веф соип®$ (ас) 


соипе$_ехр 


Примерно в 50% случаев выходная битовая строка для этой схемы должна быть 
равна 000, а в остальных 50% случаев она должна быть равна 111. Однако эти 
системы являются "зашумленнными" квантовыми компьютерами среднего 
масштаба (п015у, пегтедае-зса]е диатит, МО). Должны быть выведены ре- 
зультаты, похожие (но не идентичные) на следующие: 


>>> соипЕ5_ехр 
{'000': 467, '001': 15, 


'111': 338} 


>>> 
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имеггир* Ведчез+ (!1ВО) 105, 108 

|1птеггир* зегмсе гоште (158) 262 

|пкеггир: уестог {аЫе (МТ) 262 

РПопе 40 

РВопе 13 Рго Мах 381 


К 
Кегпе!-Базед Уиа! Маспте (КУМ) 373 


[В 


Газ т, Аг оц (ЦРО) 52 
Геа${ гесепй у изед (1ВИ) 240 
ЦКесот 460 

№е-еп@Гап 99 

[оад уаше т/есНоп (1\!) 424 
оса! агеа пе могК (ЕАМ) 143 
[оокир {аЫе (ШТ) 348 
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[ом/-ромег доцЫе Дда{а га1е КАМ (1Р-ООВ4х) 381 
1иттИегоц$ ае{Пег 143 


М 


М.2 138 

МаМаге 412 

Мап т {Ле таае (МПМ) 413 

Ма$ег Боос гесога (МВК) 162 

Метогу тапаретеп{ ипй (ММУ) 223 

Метогу ргщесНоп еЖжепз!оп$ (МРХ) 300 

Метогу ргщесйоп ипк (МРИ) 279 

Мепог Моде|$1т РЕ $+идеп{ ЕЧ оп 531 

Мсгозо В Алиге 397 

МИюп тгисНоп$ рег $есопа (М!Р$) 37 

Мивр!е тугисНоп, ти р/е да*а (ММО) 176, 
256 

Мур!е-триу-тир!е-оцёри{ (ММО) 145 

Мивр!е-155$ие ргосез$ тв 248 

Мувру асситща{е (МАС) 190, 212, 256, 404 


М 


Макига! [апечаве ргосез$тв (МЕР) 402 

Меаг-Не!4 соттипсайоп (МЕС) 204 

Меига|! пе могК ргосе$$ог Фог т{егепсе (ММР-1) 
404 

Меига! пе{м/огК ргосе$зог Гог {гаттв (ММР-Т) 
401 

Моп-Ма$КаЫе |птеггир (ММ!) 105, 110 

Мопуо!а е тетогу (МММ) 160 


О 


Огвапс ИМ-етИитв Чоде (ОГЕО) 383 
Ощ-о{-Огдег тугисйоп ехесийоп (Оо0) 251 


Р 


Раре Чтесгогу Базе гер1${ег (РОВВ) 217 

Раве гате питьег (РЕМ) 222 

РС! Ехрге$$ (Ре) 136 

РегрКега! Сотропеп* \егсоппесЕ (РС|) 135, 
153 

РоцаЫе орега{тЕ у {ет и(еГасе (РОЗХ) 358 

Ро\ммег-оп $еН{-(ез1 (РО$Т) 159 

Ргосе$$ сопго! Моск (РСВ) 170 

Ргосе$$ 14еп Мег (Р!О) 170 
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а 


ОЕМУ 365, 374 
О!5Ке{ 504 


[4 


ВКапдоп1 ассе$$ тетогу (ВАМ) 124, 212 
Ваце-попо{опгс зспеди!пв (ВМ$) 172 
Веа4-оп!у петогу (КОМ) 159, 213 

Веа|-Ите орега тв эу${ет (ВТО$) 166 

Весийед Ипеаг ИпК (ВЕШИ) 479 

Ведисе т${гисйоп 5е{ сотри{ег (В15С) 96, 249 
Вер15{ег {гап$Рег [еуе! (ВТ) 350 

В15С-\ 32-58 И\ерег тхгисНоп 5е{ (К\З21) 340 
В\З21, набор инструкций 340 

В\641, набор инструкций 345 


5 


ба!ег тоде еЖж{епзоп$ ($МХ) 300 

эса1аЫе ИпК 1п{еГ{асе (51) 148 

5есиге бичага Ежеп$юп$ (5СХ) 423 

Зесиге Назбтв А!вогИиПт (5$НА-256) 164 

5ега! АТ АКасНтеп: (5АТА) 137 

5е{-гезех [атсВ (58) 66 

Урпа|-{о-по!5е гаНо (5$МВ) 191 

те Дата гате (508) 129 

пе т${гисНоп, тире даа ($1МО) 41, 176, 
229, 256, 343 

та! ощИпе О1ММ 129 

5оНд-5аке 4г/уе$ (550) 138 

Уайс гапдот ассез$ тетогу ($КАМ) 233 

У(геаттр $1МО Ежеп$!оп$ (5$Е) 256 

бупсИгопои$ ОКАМ (50ВАМ) 129 

бучет-оп-то4дше (5оМ) 615 


т 


Тепзог ргосе$5ог си${ег$ (ТРС) 403 
ТепзогН/о\м/ 386 
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Тегтта{е ап4 ${ау гез еп (ТВ) 214 

Тигеад сопёго! Моск (ТСВ) 170 

Тргеад 1еп\ ег (710) 170 

ТвупдегБой 139 

ТИе-базед де{егге4 гепдегтв (ТВОВ) 382 

Тгапзасйопа!| зупсИгопта юп еЖ{епт$юп$ (Т$Х) 
300 

Тгапа{оп 1ооказае Би#ег (ТЬВ) 224, 230 

Тгие4 р!аМогт тодще (ТРМ) 165, 280 


и 


пед ЕжепзЫе Егтмуаге |птегасе (ЦЕН!) 160 
приложения 161 

Упм№ега! Зета! Виз (Ц5В} 119, 138 

Ип$Не!де9 {м $ед-ра!г (ЦТР) 144 


\ 


\М4ео бгарМс$ Аггау (УСА) 141 

Миа! Аддге$5 е{епз!оп (МАХ) 216 
\Миаоса| агеа пе \могКк (МЁАМ) 359 
Миа! таспте еЖеп$!оп$ (УМХ) 300. 
Миа! тетогу зу${ет (УМ5) 216 
Мииа!Вох 372 

\Ммадо Везет $ийе 531 

\УМмаге М/огк$а{ оп 373 


М/ 


М/агерои$е-зса!е сотрщег (\М/5С) 389 
МЛде агеа пе’могк (М/АМ) 143 

МЛ-Е 145 

МЛ-Е Г Ргдщесе4 Ассе$ 2 (\М/РА2) 145 


Хх 


Хеп 374 
ХШпх \Ммадо Оезеп 531 
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А 


Авария 362 
Автомат конечный 70 
Адресация: 
индексная 293 
относительная 293 
с масштабированием 294 
непосредственная 292 
неявная 292 
регистровая 292 
косвенная 293, 315 
с двумя регистрами 316 
с двумя регистрами и 
масштабирование 316. 
со смещением 315 
со смещением и постинкрементом 315 
со смещением и преинкрементом 315 
прямая 315 
режим 98, 99, 100, 102-104, 106, 107 
с прямым доступом к памяти 293 
Алгоритм: 
$НА-256 442 
вытесняющий 171 
невытесняющий 170 
обработки сигналов 192 
планирования 172 
Шора 502 
Альткоин 459 
Анализ спектральный 195 
Архитектура: 
ААгспб4 321 
АКМ 310 
АКМУ8-А 312 
К!$С-У\ 328 
х86 288 
2еп3 385 
гарвардская 190, 210 
модифицированная 190, 211 
с кешированием программных 
инструкций 191 
набора инструкций 329 
с множеством потоков инструкций и потоков 
источников данных 176 
с одним потоком инструкций и множеством 
потоков данных 176 
симметричная многопроцессорная 176 
фон Неймана 395, 190, 208 
узкое место 190 
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Атака: 
на объект инфраструктуры 414 
со взломом паролей 411 
через скрытые каналы 418 
Аутентификация двухфакторная 617 


Б 


Базовая система ввода-вывода 158 
перезапись 159 
Байт 45 
Банк: 
памяти 130 
фильтров 195 
Бит 45 
допустимости 236 
знаковый 271 
инверсия 48 
квантовый 44, 500 
режима: 
пользователя 267 
супервизора 267 
факта записи 242 
Биткоин 437 
Блок: 
защиты памяти 279 
линейной ректификации 479 
управления: 
памятью 223, 287 
потоком 170 
процессом 170 
Блокировка 34 
взаимная 184 
Блокчейн 437 
Ботнет 411 
Бот-сеть 411 
Буфер: 
ассоциативной трансляции 224, 230 
переполнение 209, 430 


Ввод загружаемого значения 424 
Ввод-вывод 299 
высокоскоростной 135 
программируемый 114 
с распределением: 
памяти 113 
по портам 113 
с управлением по прерываниям 114 
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Вектор 189 
Вентиль: 
И 63 
ИЛИ 64 
исключающее ИЛИ 64 
НЕ 61 
Ветвление: 
прогнозирование 253 
условное 253 
Взлом: 
кода квантовый 501 
пароля методом полного перебора 411 
Виртуализация 356, 375 
вложенная 358 
полная 360 
приложений 358 
процессора: 
АКМ 370 
К!$С-\У 371 
х86б 368 
с перехватом и эмуляцией 361 
сетей 359 
хранилищ 359 
Вирус 413 
Выборка предварительная 132 
Выполнение упреждающее 254, 424 
Вычисления: 
адиабатические квантовые 502 
квантовые 44, 500 
конфиденциальные 422 
облачные 375 
удаленные 423 


Г 


Генератор кварцевый 76 
Гипервизор 357 

аппартартный 357 

типа 1 357 

типа 2 357 

хостовый 357 
Гиперпараметр 482 
Глобальная система мобильной связи 40 
Граница естественная 288 
Группировка 479 

с выбором максимума 480 


д 


Данные: 
большие 199 
в движении 422 


643 


в обработке 422 
в состоянии покоя 422 
конфигурации загрузки 164 
перемещение 295, 316 
перенос 360 
сжатие 195 
без потерь 196 
с потерями 196 
Декогеренция квантовая 503 
Диспетчер загрузки 163 
М/паом5 164 
Длина слова 50 
Доказательство: 
владения 460 
работы 445 
Доступ к памяти прямой 116, 156 
Драйвер: 
режима ядра 153 
устройства 152, 156 
РС! 155 
архитектурно-независимый 161 
Дырка 121 


Е 


Емкость 125 


3 


Загрузка: 
безопасная 161 
доверенная 164 
операционной системы 162 
ускорение 161 
Загрузчик 163 
М/пдом$ 164 
Задержка распространения 74 
Закон: 
Мура 41, 494 
Ома 59 
Запись основная загрузочная 162 
Запрос на прерывание 105, 108 
Запутанность квантовая 501 
Затвор 121 
Защелка 66 
се{-гезе{ [азсН (58А) 66 
с установкой и сбросом 66 
управляемая (0) 67 
Зрение машинное 402 
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И 


Идентификатор: 
глобальный уникальный 162 
потока 170 
процесса 170 
Импульс цифровой 192 
Инверсия: 
бита 48 
приоритетов 183 
Инсайдер 410 
Инструкция 52 
по-ор 108 
арифметическая 105, 296, 317 
ввода-вывода 299 
ветвления 106 
условного 334 
возврата из подпрограммы 107. 
вспомогательная 299 
вызова подпрограммы 107 
выполнение внеочередное 251 
высислительная 333 
для работы: 
с прерываниями 107 
с флагами процессора 107 
доступа к памяти 334 
за такт процессора 246 
загрузки и сохранения 104 
логическая 106, 296, 317 
манипулирования: 
стеком 296, 316 
строками 298 
флагами 298 
небезопасная 366 
обработка конвейерная 245 
обработки прерывания 111 
отсутствия операции 108 
передачи данных из регистра в регистр 104 
перемещения данных 295 
между регистрами 317 
между регистрами и памятью 316 
потока управления 297, 318, 334 
преобразования 297 
режима защищенного 299 
системная 335 
сравнения 317 
стека 104 
Интерполяция 468 
Интерфейс: 
единый расширяемый встроенного ПО 160 
приложения 161 
переносимых операционных систем 358 
прикладных программ двоичный 331 
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Исключение 262 
взаимное 182 
нулевого указателя 226 
Исток 121 


К 


Кадр 144 
страничный 217 
номер 222 
Карта мезонинная 401 
Каталог таблиц страниц 217 
Квант 498 
Кеш: 
1 235 
2 243 
инклюзивный 244 
[3 244 
наборно-ассоциативный 239 
полностью ассоциативный 241 
с прямым отображением 235 
согласование 242 
Кеш-память 230 
веб-браузеров 231 
дисковых накопителей 230 
инструкций и данных процессора 231 
разделенная 235 
Кеш-попадание 230 
Кеш-промах 230 
Кибератака 281 
Кибербезопасность 408 
Клавиатура компьютерная 146 
механическая 146 
сенсорная 146 
Клапан спиновый 499 
Кластер тензорных процессоров 403 
Ключ: 
закрытый 165 
криптостойкий 421 
открытый 165, 280 
секретный 280 
Код: 
дополнительный 48 
коррекции ошибок 129 
операции 52, 87 
самомодифицирующийся 209 
Комиссия за транзакции 448 
Коммутатор 144 
Компаратор 187 
Компилятор 52 
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Компьютер: 
бизнес-класса 202 
игровой высокопроизводительный 203 
квантовый 502 
многопроцессорный 175 
персональный 31 
ОезКРго 39 
1ВМ РС 36 
|ВМ РС АТ 38 
с полным набором инструкций 96, 249 
с сокращенным набором инструкций 96, 249 
Конвейер: 
очистка 254 
процессора 247 
Конвейеризация 245 
конфликты 250 
Конденсатор 124 
Контекст процессора 170 
Контроллер памяти 131 
Контур фазовой автоподстройки частоты 
(ФАПЧ) 76 
Конфигурация с интегрированной графикой 
140 
Конфликты конвейеризации 250 
Коррекция квантовых ошибок 504 
Кошелек цифровой 438 
Криптовалюта 459 
Криптография постквантовая 502 
Кубит 44, 500 


Л 


Легирование 61 
Лидар 472, 482 
Линия высокоскоростного ввода-вывода 135 
Ловушка 362 
Логика: 
комбинационная 66 
последовательностная 77 
транзисторно-транзисторная (ТТЛ) 153 
Локализация 483 
Локальность: 
временная 231 
пространственная 231 
ссылок 231 


М 


Майнер 438 
биткоинов 438 
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Майнинг с помощью процессора: 
графического 450 
компьютерной архитектуры 451 
центрального 449 
Мантисса 270 
Маршрутизатор 143 
Матрица вентильная 78 
программируемая пользователем (ППВМ) 
78 
Машина: 
аналитическая Бэббиджа 32 
виртуальная 357 
Мельница 34 
Менеджер паролей 618 
Металл-оксид-полупроводник (МОП) 119 
Микрооперация 252 
Микропроцессор 36, 86 
пе! 8088 36 
Миллион инструкций в секунду 37 
Минимум: 
глобальный 502 
локальный 502 
Многозадачность 182 
Многопоточность: 
кооперативная 172 
одновременная 255 
Многопроцессорность 175 
Множитель тактовой частоты 77 
Модуль: 
доверенный платформенный 165, 280 
памяти с двухрядным расположением 
выводов (01ММ) 129 
Монитор 111 
виртуальных машин 357 
Мультиплексор 65, 89 
Мышь компьютерная 147 
Мьютекс 182 


Н 


Набор: 

обучающий 402 

рабочий 222 
Накопитель твердотельный 138 
Нанотрубка углеродная 505 
Напряжение и частота, изменение 

динамическое 276, 336 
Нарушение прав доступа 215 
Наследование приоритетов 184 
Нейропроцессор для обучения 401 
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Нейтрино 498 
Номер страничного кадра 222 


О 


Обработка: 
информации на естественном языке 402 
по потоку данных 252 
прерывания 108 
с множественной выдачей инструкций 248 
с множеством потоков инструкций и 
множеством потоков данных 176, 256 
с одним потоком инструкций и множеством 
потоков данных 41, 176, 229, 256, 343 
суперскалярная 254 
Обработчик прерывания 109 
Обучение глубокое 200 
Обход 250 
каталога 432 
Общий каталог уязвимостей 433 
Операнд 90 
Операция: 
в памяти неделимая 341 
ввода-вывода 112 
Опкод 52, 87 
Оптимизация адиабатическая квантовая 503 
Отказ: 
в обслуживании 411, 413 
страницы 218 
жесткий 220 
мягкий 220 
Отладчик аппаратный 278 
Отношение "сигнал/шум" 191 
Отрицание числа 48 
Отслеживание 243 
Очередь 185 
Очистка конвейера 254 
Ошибка 362 


п 


Память: 
ЁР-ОБОВАх 381 
ассоциативная 224 
виртуальная 214, 356 
высокоскоростная 404 
кеш 230 
оперативная 36, 87, 124, 212 
постоянная 36, 159, 212 
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произвольного доступа: 
динамическая 121, 124, 126, 231, 233 
статическая 233 
флеш 138 
энергонезависимая 160 
Пара витая 134 
неэкранированная 144 
Паравиртуализация 364 
Параллелизм на уровне инструкций 248 
Передача сигналов дифференциальная 134 
Перезапись В!0$ 159 
Переименование регистров 252 
Перемещение данных 295, 316 
Переполнение буфера 209 
Персептрон 385 
Песочница 356 
Планирование: 
очередь многоуровневая с обратной связью 
173 
первым пришел, первым обслужен 172 
с вытеснением и фиксированным 
приоритетом 172 
справедливое 173 
циклическое 172 
частотно-монотонное 172 
Планировщик 168, 170 
Плоскость цветовая 474 
Подкачка страниц 215 
Подключение "горячее" 156 
Подпись цифровая 165, 421 
Подсистема памяти 120 
Политика замещения содержимого кеша 232 
Полубайт 46 
Полупроводник 60 
Полусумматор 73 
Пользователь виртуальный 371 
Порт параллельный 153 
Порядок 270 
байтов: 
переключаемый 99 
прямой 99, 292 
Поток 168 
вытеснение 183 
разделения по времени 168 
управления 297, 318 
Права доступа, нарушение 215 
Превосходство квантовое 503 
Предел Аббе дифракционный 43 
Предикация 318 
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Представление для ВТЕ гибкое промежуточное 


350 
Преобразование: 
дискретное косинусное (ДКП) 196 
Фурье 194 
быстрое (БПФ) 194 
дискретное (ДПФ) 194 
обратное 194 
Преобразователь: 
аналого-цифровой (АЦП) 186 
последовательного приближения 188 
последовательного счета 188 
цифроаналоговый (ЦАП) 186 
Прерывание 262 
аппаратное 261 
вложенное 109 
внешнее 107 
маскируемое 107 
немаскируемое 107 
маскируемое 109 
немаскируемое 105, 110 
обработка 108 
Принцип наименьших привилегий 427 
Приоритет: 
инверсия 183 
наследование 184 
Приоритизация 171 
потоков 182 
Прогнозирование ветвления 253 
Программа резидентная 213 
Программное обеспечение: 
аттестация 423 
вредоносное 412 
вымогатель 412 
шпионское 412 
Произведение скалярное 189 
Простукивание строк 418 
Процедура обслуживания прерывания 262 
Процесс 169 
простоя 168 
системный 173 
Процессор: 
6502 49 
эмулятор 55 
80286 39 
80386 39, 286 
8086 286 
8088 286 
АМО Вугеп ТВгеадпррег 3970Х 450 
АВМ 310 


АВМ11 41 
В1$С-\ 78 
Кугеп 9 5950Х 385 
графический 43, 140, 197 
Мм ага беРогсе ВТХ 3090 386 
для цифровой обработки сигналов 186 
многоядерный 176 
скалярный 248, 256 
суперскалярный 248, 256 
центральный 86 
цифровой обработки сигналов 211 
Псевдоинструкция 336 
Пузырь конвейерный 251 
Пул: 
майнинга биткоинов 447 
памяти 222 
без подкачки 222 
с подкачкой 222 
Путь критический 75 


Р 


Радар 472 
Радиосвязь ближняя 204 
Разгон 148 
Разработка обратная 425 
Расширение: 
А 341 
С 342 
0342 
Е 342 
М 340 
безопасного режима 300 
для виртуальных машин 300 
для защиты памяти 300 
для синхронизации транзакций 300 
Регистр 50, 71, 86, 95 
С$ 37 
0$ 37 
$$ 37 
базовый каталога страниц 217 
общего назначения 36 
операция: 
вращения 71 
записи 71 
чтения 71 
переименование 252 
сдвига 70 
сегментный 37 
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сегментов памяти 36 
таблицы дескрипторов прерываний 369 
текущего состояния программы 313 
управления и состояния 335 
Режим: 
адресации 53, 98 
абсолютной 99 
индексной 100 
аккумулятора 106 
защищенной виртуальной 39 
индексной косвенной 103 
косвенной индексной 102 
непосредственной 53, 98 
неявной 104 
относительной 107 
по нулевой странице 102 
прямой 99 
гипервизора — расширенного супервизора 
371 
длинный 305 
защищенный 287, 299 
мультипрограммный 213 
обеднения носителями 121 
обогащения носителями 121 
полнодуплексный 134, 135 
полудуплексный 133 
пользователя 267 
виртуального 371 
реальный 287 
супервизора 267, 318 
виртеального 371 
Рендеринг отложенный на основе плиток 382 
Репликация 360 
Робот поисковый 394 


С 


Самотестирование при включении питания 159 
Свертка 192 
Светодиод органический 383 
Сглаживание 480 
Сектор 138 
Секция критическая 185 
Семафор 184 
двоичный 184 
подсчитывающий 184 
Сервер: 
для облачных вычислений 202 
стоечный 392 
Сервис облачный 397 


Предметный указатель 


Сеть: 
Висот 437 
виртуальная локальная 359 
глобальная 143 
искусственная нейронная 200, 478 
компьютерная 143 
локальная 143 
прямого распространения 201 
рекуррентная 201 
сверточная нейронная 474 
Сжатие: 
без потерь 196 
данных 195 
с потерями 196 
Сигнал 192 
аналоговый 186 
прямоугольный 76 
тактовый 76 
Синтаксис: 
АТ&Т 292 
|пе| 292 
Система: 
вычислительная: 
жесткого реального времени 180 
изолированная 417 
мягкого реального времени 180 
майнинга биткоинов 438 
модульная 615 
операционная 166 
виртуализированная 357 
гостевая 357 
загрузка 162 
нереального времени 167 
реального времени (ОСРВ) 166, 182 
позиционирования глобальная 470 
с симметричной многопроцессорной 
архитектурой 176 
файловая 162 
Скорость передачи данных: 
базовая 129 
удвоенная 129 
Смартфон 380 
Соло-майнинг 449 
Сонар 473 
Сопроцессор: 
|п{е! 8087 38 
математический 248, 272 
Спин 498 
Спинтроника 499 
Стандарт шифрования усовершенствованный 
300 


Предметный указатель 


Стек, манипулирование 296 
Сток 121 
Страница 214 
отказ 218 
жесткий 220 
мягкий 220 
Строка кеша 235 
Сумматор 73 
полный 73 
простой 73 
со сквозным переносом 73 
Супервизор 266 
виртуальный 371 
Суперконвейеризация 249 
Суперпозиция квантовая 500 
Схема: 
выборки-хранения 187 
интегральная 36 
на основе комплементарной 
МОП-структуры (КМОП) 123 
комбинационная 90 
логическая: 
последовательностная 77 
усовершенствованная транзисторно- 
транзисторная с барьерами Шотки 
(УГТЛШ) 75 
программируемая логическая интегральная 
(ПЛИС) 328, 348, 452 
синхронная 71 
специализированная интегральная 455 
Сценарий, межсайтовое выполнение 430 
Счетчик: 
кольцевой 70 
программный (ПС) 87 


т 


Таблица: 
векторов прерываний 262 
истинности 62 
поиска 348 
разделов 6 162 
страниц 217 
теневая 367 
Тензор 403 
Терафлопс 199 
Технология использования нескольких 
передающих и нескольких приемных антенн 
145 
Транзакция 136 
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Транзистор 36, 60 
биполярный 121 
полевой: 
на основе структуры металл-оксид- 
полупроводник (МОП) 121 
на углеродных нанотрубках 504 
униполярный 121 
Трансляция: 
двоичная 364 
динамическая 365 
статическая 365 
Трассировка лучей 386 
Трекбол 147 
Триггер 69 
срабатывающий по фронту сигнала (0) 69 


У 


Узел: 
клиентский 445 
полный 444 
Указатель 226 
стека 51 
Умножение с накоплением 190, 212, 256, 404 
Умножитель частоты с ФАПЧ 77 
Управление централизованное 360 
Уровень: 
межрегистровой передачи 350 
привилегий 338 
Устройство: 
арифметико-логическое (АЛУ) 86, 90 
запускаемое: 
по уровню сигнала 69 
по фронту сигнала 69 
мобильное 165 
оперативное запоминающее (ОЗУ) 36, 87, 
212 
постоянное запоминающее (ПЗУ) 36, 159, 
212 
управления 86, 87 
электрически стираемое программируемое 
постоянное запоминающее (ЭСППЗУ) 213 
Уязвимость нулевого дня 412 


Ф 


Файл подкачки 215 
Физика квантовая 498 
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Фильтр: 
Калмана 470 
полосно-заграждающий 193 
полосно-пропускающий 193 
частотно-избирательный 192 

Фишинг 410 

Флаг 51 

Флеш-память 138, 213 

Формат половинной точности 288 

Функция активации 200 


Х 


Хакер: 

белый 410, 411 

черный 411 
Характеристика импульсная 192 
Хеш-алгоритм $НА-256 442 
Хеш-конфликт 442 
Хеш-функция криптографическая 164 
Хост 357 
Хранилище резервное 230 


Ч 


Человек посередине 413 

Червь 413 

Чиплет 496 

Чипсет 133 

Число: 
двоичное 45 
действительное 194 
денормализованное 565 
мнимое 194 


Предметный указатель 


отрицание 48 
спиновое квантовое 499 
шестнадцатеричное 45 


Ш 


Шина: 
битов 126 
данных последовательная 134 
слов 126 
Шифрование с открытым ключом 280 
Шпион клавиатурный 414 


Э 


Эквалайзер графический 195 
Экстраполяция 468 

Элемент частотный 194 

Эмуляции аппаратных средств 365 
Эфир светоносный 143 

Эффект пьезоэлектрический 76 


Ядро 153 
Язык: 
СН5е] 349 
эса!а 349 
\МегЙов 79 
УНОУ 78 
ассемблера 52, 301 
К!$С-\У 347 
высокого уровня 52 
описания аппаратных средств 78 


|) ру ® Жуков А. 
С Ассемблер и программная модель 
м\ммм.БПУ.ги 


процессоров х86/64 


Отдел оптовых поставок: 
е-тай: орк@БВуУ.ги 


| ото |. Ассемблеры а86/а386 


® Мегм!4е АззетЫег (пазт) 


Ассемблер 8 ® Система команд 180х86/64 


‘ипрограммная модель = 


‚ процессоров ив 6/6 е 32-битный защищенный режим 


`Абсвмблеры 2864386 
№ Азат (лаве) 


безшюавиии С | » 64-битные режимы 
‚32 битный защищенный режим Е 


"64 битные режимы 


Книга является практическим пособием по программной модели процессоров 
180х86/64. Простейшие элементы этой модели (переменные, константы, методы адре- 
сации и система команд) изучаются с помощью ассемблера а86, отладчика 486. 
32-битные возможности 180х86, включая защищенный режим, вентили, исключения 
и прерывания, привилегии, страничное преобразование, исключения, ГОТ и Т5$5, 
а также 64-битные режимы процессора хб64 с исключениями и прерываниями в [018 
тоде изучаются с использованием ассемблера пазт. 

Электронный архив на сайте издательства содержит исходные тексты примеров 
и необходимые для работы файлы. 

Жуков Андрей Владимирович, кандидат технических наук, преподаватель Санкт- 
Петербургского политехнического университета, программист в области автоматизации 


управления. Автор книги и практических курсов по ассемблерам, трансляторам, интерфейсам 
внешних устройств, микроконтроллерам, РГ.С и промышленным сетям. 


1 Ревич Ю. 


Занимательная электроника. — 7-е изд., 
Ул перераб. и доп. 


Отдел оптовых поставок: 
е-тай: ор{@ЬПу.ги 


® Начала начал электроники 


Электроника 


® Оборудуем домашнюю лабораторию 
® Транзисторы, резисторы, конденсаторы, дисплеи 


® Операционные усилители, импульсные 
р источники питания 


занимательная |. Аналоговые и логические схемы, 
ЭЛЕКТРОНИК А микроконтроллеры 


ооо ® Агдишо — электроника для домашнего мастера 


з Транзисторы, пезисторы, ковденсаторы, дисален 
< Оиерециовные усилители, имвульскые источники питания: 
> Аналоговые и логические схомы, микроконтроллеры 


они вт пень ны ыы ФБ е Импортозамещение по-китайски: улучшенный 
аналог Агдито 


е ..-( 
® 


На практических примерах рассказано о том, как проектировать, отлаживать и из- 
готавливать электронные устройства в домашних условиях. От физических основ 
электроники, описания устройства и принципов работы различных радиоэлектрон- 
ных компонентов, советов по оборудованию домашней лаборатории автор перехо- 
дит к конкретным аналоговым и цифр вым схемам, включая устройства на основе 
микроконтроллеров. Приведены элементарные сведения по метрологии и теорети- 
ческим основам электроники. Дано множество практических рекомендаций: от 
принципов правильной организации электропитания до разводки плат и приобре- 
тения компонентов применительно к российским условиям. В 7-м издании обнов- 
лены многие разделы, содержавшие устаревшие сведения, подробнее рассказано об 
источниках тока для осветительных приборов, измерениях электрических величин, 
генераторных схемах, импульсных источниках питания, добавлены новые примеры 
применения платформы Агдипо, а также приведен пример усовершенствованного 
контроллера китайского производства для замены Агдито. 


Ревич Юрий Всеволодович, инженер-электронщик с многолетним стажем. Занимался ав- 
томатизацией производств, конструированием измерительных приборов для изучения океа- 
на и других научных исследований. Начиная с 2000-х — ГТ-обозреватель и журналист на- 
учно-популярной тематики. Основной круг интересов — информационные технологии, их 
влияние на современное общество, история компьютеров и электронных приборов. Имеет 
несколько сотен публикаций в журналах, газетах и сетевых изданиях. Автор более 10 книг, 
среди которых «Программирование микроконтроллеров АУБ: от Аг4ито к ассемблеру», 
два сборника «Информационные технологии в СССР» и др. 


Неад 21:58. СЁ 


су Ганди Р. 


мимим.БАУ.ги 


Отдел оптовых поставок: 
е-тай: ор @БЬЛПуУ.ги 


ОВЕН“ 


Неаа Е1т5% 
ед: 
Лучший способ 


понять СИ 
изнутри 


Раджу Ганди 


Книга поможет быстро и легко изучить самый популярный в мире инструмент кон- 
троля версий Си. В ней использована уникальная методика Неад Е! выходящая 
за рамки синтаксиса и инструкций по решению конкретных задач, а эффектное ви- 
зуальное оформление разработано с учетом того, как работает и наиболее продук- 
тивно усваивает информацию мозг. 


Рассмотрены основы С, свойства ветвления кода, слияние, коммиты, устройство 
репозитория СЁ и поиск в нем, отмена действий и исправление ошибок. Особое 
внимание уделено командной работе с Си, передовым методам взаимодействия 
и советам профессионалов по эффективной работе. 


Гон С. 


оРу° 
ОосКег без секретов: Пер 


ммм". БЛУ.ГИ 


Отдел оптовых поставок: 
е-тай: ор @ЬПу.ги 


В книге описаны: 


® Основы работы с контейнерами и экосистемой 
ПОСВЕК оскег 


Ее ® Использование образов ОосКег 


РИИОЖЕНИЙ С ПОМОЩЬЮ ООСЖЕА ® Работа с хранилищами ОоскКег Зюгаге 

® Использование плагинов в сервисах ОоскКег 
® Развертывание служб в З\апп 

® Сетевые возможности ОоскКег 


® Безопасность приложений в экосистеме ОосКег 


® Масштабирование и поддержка контейнерных 
приложений 


Книга подробно рассказывает о развертывании и поддержке контейнерных прило- 
жений с использованием технологии ПоскКег. Описан принцип работы образов, кон- 
тейнеров и связанных с ними хранилищ РосКег Зогаре, рассмотрена система кон- 
тейнеризации ОосКег З\аппт, показаны принципы сетевого взаимодействия 
Сошашег Мебмогк Моде!. Раскрыты вопросы использования плагинов в сервисах 
РосКег, рассмотрено развертывание служб в З\аппт. Отдельная глава посвящена 
обеспечению безопасности в экосистеме Поскег, масштабированию и поддержке 
контейнерных приложений. 

Сайбал Гош, главный программный архитектор в компании Епс$$оп ша 144. с более чем 
двадцатилетним опытом в сфере [Т-инфраструктуры и безопасности, консалтинга и разработ- 
ки ПО. За свою карьеру он успел примерить на себя разные роли, включая администратора 
баз данных, технического консультанта, технического писателя, разработчика приложений 
и преподавателя. 


10$ и 1РЮопе глазами хакера 


©у° 


мили. БАУ.ГИ 


Отдел оптовых поставок: 
е-тай: ор@ЬПу.ги 


® Средства безопасностии новые возможности 


6 7 в 105 16 
Ю$ И | р Ю (©) ПВ = ® Особенности распространения троянов для 105 
лазами ® Шпионаж за пользователем при помощи 


выключенного 1Рвопе 
х АКЕРА ® Эксплойт сВесКп8 и его использование 
98 ® Джейлбрейк — как сделать и зачем он нужен? 

уе ® Неофициальные твики и приложения для 105 

с джейлбрейком 
» Альтернативы для Суда 
® Установка сторонних приложений на 1РВопе без 

джейлбрейка 
® Настройка УРМ на 1Рвопе 


® Автоматизация 10$ с помощью инструмента 
«Команды» 


® Установка альтернативных ОС на 1Рвопе 
с помощью виртуальных машин 
» Написание программ на Ру@оп в среде 
разработки Рую 
Эта книга — сборник лучших, тщательно отобранных статей из легендарного жур- 
нала «Хакер». Рассмотрена система безопасности 10$ 16, методы сбора и передачи 
информации устройствами Арр!е при выключенном питании. Рассказано о методах 
взлома файловой системы (джейлбрейк), об уязвимости эксплоита сВескиа8, об ус- 
тановке твиков и сторонних приложений на 1РВопе. Раскрыты методы установки 
стороннего ПО на мобильные устройства с 105 без джейлбрейка. Приведены аль- 
тернативы менеджеру пакетов Суфа, рассказано об использовании виртуальных 
машин в 105. Представлены способы настройки УРМ и автоматизации 10$ при по- 
мощи инструмента «Команды». Приведен обзор возможностей Рую — среды про- 
граммирования на РуШоп для мобильных устройств Арр!е. 
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ИНТЕРНЕТ-МАГАЗИН Интернет-магазин издательства «БХВ» 


. Более 30 лет на российском рынке 
. Книги и наборы по электронике 
|| и робототехнике по издательским ца 
КНИГИ, РОБОТЫ, —-Э^епронныеарживыкни 
} Ту 
ЭЛЕКТРОНИКА —.оеъынавова ны 
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Интернет-магазин БХВ-длектроника 
Скоро открытие! 


Цветные иллюстрации 


| 


Введение 
в архитектуру компьютеров 


7 


0 
р ММиво С 


Рис. 1.1. Набор регистров процессора 6502 


Цветные иллюстрации 


Цифровая логика 


ОВ 


Рис. 2.1. Простая резистивная схема 


Э 


Рис. 2.2. Схематическое обозначение транзистора типа п-р-п 


ОВ 


Рис. 2.3. Транзисторный вентиль НЕ 


Цветные иллюстрации 


Вход Выход 


Рис. 2.4. Схематическое обозначение вентиля НЕ 


Выход 


ОВ 


Рис. 2.5. Транзисторный вентиль И 


Выход 
В 


Рис. 2.6. Схематическое обозначение вентиля И 


Выход 


Рис. 2.7. Схематическое обозначение вентиля ИЛИ 


Выход 


Рис. 2.8. Схематическое обозначение вентиля исключающего ИЛИ 
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Рис. 2.9. Схема мультиплексора с двумя входами 


Рис. 2.10. Схема 5$К-защелки 


Рис. 2.11. Схема управляемой О-защелки 


Рис. 2.12. Схематическое обозначение О)-триггера 
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Рис. 2.13. Схема четырехпозиционного кольцевого счетчика 
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Рис. 2.15. Схема полного сумматора 
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Рис. 2.16. Схема 4-разрядного сумматора 


Рис. 2.17. Прямоугольный сигнал 
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Элементы процессора 


у Память Рис. 3.1. Взаимодействие 
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блоками процессора 
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Извлечение 
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Изменение Нет 


Выполнение Увеличение 


Инструкция 
ветвления? 


содержимого 


ПС инструкции ПСна1 


Рис. 3.2. Цикл выполнения инструкции 
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Рис. 3.3. Инструкции ТХА и ТУА процессора 6502 


8 Левый операнд 


сумматор 


Правый оператор 


Мультиплексор 


СК 


Рис. 3.4. Операции сложения и вычитания в процессоре 6502 
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Компоненты 
компьютерной системы 
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Рис. 4.1. п-Канальный МОП-транзистор в режиме обогащения носителями 


Исток 
Затвор 


Сток 


Рис. 4.2. р-Канальный МОП-транзистор в режиме обогащения носителями 


р-канальный 
МОП-транзистор 
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Рис. 4.3. КМОП-схема вентиля НЕ 
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Шина слов 


1 
Т 


Рис. 4.4. Схематическое обозначение 


Шина битов 


конденсатора 


Рис. 4.6. Организация банка памяти БКАМ 


Тх Вх 


Рис. 4.7. Схема последовательной шины с дифференциальной передачей сигналов 
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Аппаратно-программный 
интерфейс 


(®) Везоигсе Мопйог — о х 
Не Мопйог Нер 
Оуеглем  СРИ Метогу ОБК № емо 


СРИ № 10% СРИ Цваде № 65% Махитит Егедшепсу ^. 
С итаде РО Оезспрё. — $ ТЬгеаф СРУ  Амегад. ^ 
С] $уяет 4 МТ Кег_ — Виппид 256 11 268 

| Зуяет еггир5 . Оефете_ — Киппта . 2 095 

С] ретопиехе 23512 — Везоигс. — Кипитд 17 1 1.50 

С) эмпояехе (посабегисеМоМее. 6708 — НояРг. — Киппта 18 1 003 

С] мопопбесийуехе 7988 — Мопоп_ Кипа 45 0 0.001 

0 № опоп$есигу.ехе 7208 № поп Китти 85 0 202 

С.) $куре.ехе 14552 — $Куре Випп9 11 0 023 

С.) $куре.ехе 15152  $Куре Випп 9 49 0 0.13 

| ОгорБох.ехе 28156 ОгорБох Киппмд 128 0 0.09 

С экрояехе (МемоКбегисе -р) 2872 Ноя Рг_ — Виппта 12 0 0.06 

С весемегехе 13080 — Сик Ве.  Киппта 40 0 0.04 

С сязхехе 984 Киппто 14 0 0.03 

[1] тведде:ехе 13108 (— Мкгозо. — Киппта 29 0 0.03 

С] автопеехе 5328 — СТЕ\оа. Кипа 12 0 001 

| змспозехе (ОсогтЕаипсВ -р) 1196 Ноя Рг Киппмпа 11 0 0.01 В 
Г ие БИО ВЕТ -> 7- И. УЧЕНИЕ Ч А — а_ п12__ 


ОБк 18 55 МВ/зес ОБК ИО › № 15% Нювех Асшме Типе а 


МемогК Ш 1к>5 Мемогк ИО № 0% Мемиогк Цббгабоп У 
Метогу № 4 Нагд Рациз/зес № 34% (ед РВузса! Метюгу ^. | 


паде РО Нагд Ра.. Сопитй.  \Моцап.  ЗВагеаБ.  Римае (_- ^ 
Метогу Сотргезюп 3612 0 1412 228448 0 228448 
ОгорБох.ехе 28156 0 226028 — 334388 124440 — 209,948 
дуаехе 15212 0 393836 — 208,976 23,896 — 185,080 
№опоп$еситуехе 7208 0 363,668 — 203,356 32,068 171,288 
де гамз-1оофох.ехе 12348 0 172356 169,944 25,640 — 144,304 
ЗеагсНАррехе 15824 0 1365924 203464 81,140 — 122,324 
5Куреехе 15152 0 175,772 151,292 79436 71,856 
аидюддехе 5812 0 119,164 70,132 12,128 58,004 


Рис. 5.1. Экран сведений о процессах в Юезоигсе Мопйог ИГп4ои!/$ 
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9 9 0 05 6.0 0.0 0: гси БВ 
0 0 0 5 @.е е@.6 0: мтогае1оп/0 
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Рис. 5.2. Экран с информацией о процессах [тих, выведенной по команде Фор 
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Специализированные вычисления 


Инициализация таймера 
и устройств 
ввода-вывода 


Ожидание таймера 


Чтение входных данных 
Вычисление 
выходных данных 
Запись выходных данных 


Рис. 6.1. Поток управления системой реального времени 
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Рис. 6.2. ЦАП лестничного типа К-2Ю 
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хранения 


Выход 
компаратора 


Компаратор 


Управление Вход ЦАП 
схемой выборки- 
хранения 


Рис. 6.3. Архитектура АЦП 


Рис. 6.5. Трехуровневая сеть прямого распространения 
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процессора и памяти 
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Рис. 7.1. Фон-неймановская архитектура 
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Рис. 7.2. Гарвардская архитектура 


14 


Цветные иллюстрации 


Процессор 
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Память данных 
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Рис. 7.3. Модифицированная гарвардская архитектура 


Номер бита: 31 22 21 12 11 0 
32-битный 
виртуальный 


адрес: 
$00402003 


Регистр СВЗ 


Каталог Таблица Страничный 
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к в 


Рис. 7.4. Трансляция виртуального адреса в физический 


Смещение | Смещение | Смещение 
каталога таблицы кадра 
00 0000 0001 00 0000 0010 00 0000 0011 
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Буфер ассоциативной трансляции (ТВ) 
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Одновременные 
сравнения 
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Виртуальная страница $82ЕЗВ Страничный кадр $03052 
Виртуальная страница $10000 Страничный кадр $55ЕАЕ 
Виртуальная страница $03С03 Страничный кадр $6Е821 


Рис. 7.5. Работа буфера ассоциативной трансляции 


Совпадение 


Цветные иллюстрации 


Методы повышения 
производительности 


Шина слов 


Шина битов 
Шина битов 


Рис. 8.1. Схема ячейки $КАМ 


Тег Набор | Байтовое смещение 


23 бита 3 бита 6 бит 


Рис. 8.2. Компоненты 32-разрядного адреса физической памяти 
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32-разрядный физический адрес 


Набор | Байтовое смещение 


23 бита 3 бита 6 бит 


1 бит 23 бита 64 байта 


Рис. 8.3. Связь 32-разрядного физического адреса с кэш-памятью 


32-разрядный физический адрес 

Байтовое И 
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смещение 


24 бита 2 бита 6 бит 


т Набор 006 
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Рис. 8.4. Работа наборно-ассоциативного кэша 
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Рис. 8.5. Последовательное выполнение инструкций 
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Рис. 8.6. Конвейерное выполнение инструкций 
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Рис. 8.7. Конвейерное выполнение с множественной выдачей инструкций 
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Специализированные расширения 
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Кольцо 1 
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Рис. 9.1. Пример защитных колец 
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устройств 
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(непривилегированные) 


Рис. 9.2. Кольца защиты в операционных системах х86 
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Короткое действительное Знак Порядок Мантисса 


число (32 бита) 1 бит 8 бит 23 бита 
число (64 бита) 1 бит 11 бит 52 бита 
число (80 битов) 1 бит 15 бит 64 бита 


Рис. 9.3. Форматы данных с плавающей запятой в сопроцессоре 8087 
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Современные архитектуры 
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Рис. 10.1. Имена и подмножества регистров 
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Рис. 10.2. Режим относительной адресации 
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Рис. 10.3. Регистры архитектуры хб4 
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Архитектура и набор 
инструкций К!$С-\ 


31 0 31 0 
ХО / гего х16/аб 


Рис. 11.1. Базовый набор регистров 15А К/5С-И 
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Рис. 13.1. Компоненты !РВопе 13 Ро Мах 
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4х1 Гбит/с 
ма 


Распределение электропитания Жж——————— Электропитание 


Рис. 13.2. Стойка с 16 серверами 


Интернет 


2% 
НЫ: Стойка 


Рис. 13.3. Внутренняя сеть И/5С 
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Рис. 13.4. Экран простого приложения Моде.]5 


Не Ед З@есноп \Мем бо ОеБид Тегтипа! Нер 
+ © 


заесЕ биб5спрНопс... 


Рис. 13.5. Добавление параметра приложения 
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> КЕЗОУВСЕ СКОУР$ 
> НЕР АМО ГЕЕОВАСК 
`^ АРР 5ЕКМКЕ 


Рис. 13.6. Развертывание в облаке 
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Рис. 13.7. Добавление параметра приложения 
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Архитектуры блокчейна 
и майнинга биткоинов 


Блок Х-2 Блок Х-1 Блок Х 


Транзакция 0 Транзакция 0 
Транзакция 1 Транзакция 1 
Транзакция 2 Транзакция 2 


Рис. 15.1. Упрощенное представление блокчейна 
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Рис. 15.2. Простая реализация майнинга на основе ПЛИС 
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Рис. 15.3. Конфигурация аппаратных средств Апйттег $19 Рго 
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Архитектуры для самоуправляемых 
автомобилей 


ВСВ-изображение 
Свертка № 1 и КЕШ 
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Свертка № 2 и КЕШ 
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Сглаживание 
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Идентификация объектов 


Рис. 16.1. Уровни СММ, используемые для идентификации объектов 
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Рис. 16.2. Компоненты и процессы автономной системы вождения 
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Рис. П1. Схема вентиля И-НЕ 


Выход 


ОВ 


Рис. П2. Схема вентиля ИЛИ 


33 


Цветные иллюстрации 34 


Рис. ПЗ. Схема вентиля И-НЕ 
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С:\> 


@ 0: ==] № 62 ©@ @ ВЕ9ВЕ сы 
Рис. П4. Копия экрана Егееро$ 
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Приемопередатчик 


Аккумулятор Процессор и ОЗУ ОВО Вай 


Управление 
энергопотреблением 


Рис. П5. Начальная схема системы сбора данных о погоде 
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приборы 


Система за рядки 
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Рис. Пб. Окончательная схема системы сбора данных о погоде 
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Рис. ПТ. Примеры изображений набора данных СЕАВ 


Идентификация объектов 


Рис. П8. Структура СММ для классификации изображений 
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Рис. ПЭ. Точность классификации изображений сетью СММ 
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